name: autopilot description: 从想法到工作代码的全自主执行

<Purpose> Autopilot接收一个简短的产品想法，并自主处理完整生命周期：需求分析、技术设计、规划、并行实现、QA循环和多视角验证。它从2-3行的描述中生成经过验证的工作代码。 </Purpose>

<Use_When>

用户希望从想法到工作代码的端到端自主执行
用户说“autopilot”、“auto pilot”、“autonomous”、“build me”、“create me”、“make me”、“full auto”、“handle it all”或“I want a/an…”
任务需要多个阶段：规划、编码、测试和验证
用户希望无干预执行，并愿意让系统运行到完成 </Use_When>

<Do_Not_Use_When>

用户希望探索选项或头脑风暴——使用plan技能
用户说“just explain”、“draft only”或“what would you suggest”——以对话方式回应
用户需要一个单一的重点代码更改——使用ralph或委托给执行器代理
用户希望审查或批评现有计划——使用plan --review
任务是快速修复或小错误——使用直接执行器委托 </Do_Not_Use_When>

<Why_This_Exists> 大多数非平凡的软件任务需要协调的阶段：理解需求、设计解决方案、并行实现、测试和验证质量。Autopilot自动编排所有这些阶段，使用户可以描述他们想要什么，并接收工作代码，而无需管理每个步骤。 </Why_This_Exists>

<Execution_Policy>

每个阶段必须在下一个开始前完成
在可能的情况下，在阶段内使用并行执行（第2阶段和第4阶段）
QA循环最多重复5次；如果相同错误持续3次，停止并报告根本问题
验证需要所有审查者的批准；被拒绝的项目修复并重新验证
任何时候使用/oh-my-claudecode:cancel取消；进度保存以便恢复 </Execution_Policy>

<Steps>

阶段0 - 扩展：将用户的想法转化为详细规范
- 分析师（Opus）：提取需求
- 架构师（Opus）：创建技术规范
- 输出：.omc/autopilot/spec.md
阶段1 - 规划：从规范创建实施计划
- 架构师（Opus）：创建计划（直接模式，无访谈）
- 批评者（Opus）：验证计划
- 输出：.omc/plans/autopilot-impl.md
阶段2 - 执行：使用Ralph + Ultrawork实施计划
- 执行器低（Haiku）：简单任务
- 执行器（Sonnet）：标准任务
- 执行器高（Opus）：复杂任务
- 并行运行独立任务
阶段3 - QA：循环直到所有测试通过（UltraQA模式）
- 构建、lint、测试、修复失败
- 最多重复5个循环
- 如果相同错误重复3次，提前停止（表明根本问题）
阶段4 - 验证：并行多视角审查
- 架构师：功能完整性
- 安全审查员：漏洞检查
- 代码审查员：质量审查
- 所有必须批准；拒绝时修复并重新验证
阶段5 - 清理：成功完成后删除所有状态文件
- 删除.omc/state/autopilot-state.json、ralph-state.json、ultrawork-state.json、ultraqa-state.json
- 运行/oh-my-claudecode:cancel进行干净退出 </Steps>

<Tool_Usage>

在首次使用MCP工具前，调用ToolSearch("mcp")以发现延迟的MCP工具
使用ask_codex与agent_role: "architect"进行阶段4的架构验证
使用ask_codex与agent_role: "security-reviewer"进行阶段4的安全审查
使用ask_codex与agent_role: "code-reviewer"进行阶段4的质量审查
代理首先形成自己的分析，然后咨询Codex进行交叉验证
如果ToolSearch找不到MCP工具或Codex不可用，继续执行——永远不要因外部工具而阻塞 </Tool_Usage>

<Examples> <Good> 用户：“autopilot A REST API for a bookstore inventory with CRUD operations using TypeScript” 为什么好：特定领域（书店），明确功能（CRUD），技术约束（TypeScript）。Autopilot有足够的上下文扩展为完整规范。 </Good>

<Good> 用户：“build me a CLI tool that tracks daily habits with streak counting” 为什么好：清晰的产品概念，具有特定功能。“build me”触发激活autopilot。 </Good>

<Bad> 用户：“fix the bug in the login page” 为什么不好：这是一个单一的重点修复，不是多阶段项目。使用直接执行器委托或ralph代替。 </Bad>

<Bad> 用户：“what are some good approaches for adding caching?” 为什么不好：这是一个探索/头脑风暴请求。以对话方式回应或使用plan技能。 </Bad> </Examples>

<Escalation_And_Stop_Conditions>

当相同QA错误在3个循环中持续时，停止并报告（需要人工输入的根本问题）
当验证在3轮重新验证后仍失败时，停止并报告
当用户说“stop”、“cancel”或“abort”时停止
如果需求太模糊，扩展产生不明确的规范，暂停并在继续前向用户澄清 </Escalation_And_Stop_Conditions>

<Final_Checklist>

[ ] 所有5个阶段完成（扩展、规划、执行、QA、验证）
[ ] 阶段4中所有验证者批准
[ ] 测试通过（用新测试运行输出验证）
[ ] 构建成功（用新构建输出验证）
[ ] 状态文件清理
[ ] 用户被告知完成，并总结构建内容 </Final_Checklist>

配置

可选设置在.claude/settings.json中：

{
  "omc": {
    "autopilot": {
      "maxIterations": 10,
      "maxQaCycles": 5,
      "maxValidationRounds": 3,
      "pauseAfterExpansion": false,
      "pauseAfterPlanning": false,
      "skipQa": false,
      "skipValidation": false
    }
  }
}

恢复

如果autopilot被取消或失败，再次运行/oh-my-claudecode:autopilot以从停止处恢复。

输入最佳实践

具体领域——“书店”而非“商店”
提及关键功能——“with CRUD”、“with authentication”
指定约束——“using TypeScript”、“with PostgreSQL”
让它运行——除非真正需要，避免中断

故障排除

卡在某个阶段？ 检查TODO列表以获取阻塞任务，审查.omc/autopilot-state.json，或取消并恢复。

QA循环耗尽？ 相同错误3次表明根本问题。审查错误模式；可能需要人工干预。

验证持续失败？ 审查具体问题。需求可能太模糊——取消并提供更多细节。 </Advanced>