name: autopilot description: 从想法到工作代码的全自主执行
<Purpose> Autopilot接收一个简短的产品想法,并自主处理完整生命周期:需求分析、技术设计、规划、并行实现、QA循环和多视角验证。它从2-3行的描述中生成经过验证的工作代码。 </Purpose>
<Use_When>
- 用户希望从想法到工作代码的端到端自主执行
- 用户说“autopilot”、“auto pilot”、“autonomous”、“build me”、“create me”、“make me”、“full auto”、“handle it all”或“I want a/an…”
- 任务需要多个阶段:规划、编码、测试和验证
- 用户希望无干预执行,并愿意让系统运行到完成 </Use_When>
<Do_Not_Use_When>
- 用户希望探索选项或头脑风暴——使用
plan技能 - 用户说“just explain”、“draft only”或“what would you suggest”——以对话方式回应
- 用户需要一个单一的重点代码更改——使用
ralph或委托给执行器代理 - 用户希望审查或批评现有计划——使用
plan --review - 任务是快速修复或小错误——使用直接执行器委托 </Do_Not_Use_When>
<Why_This_Exists> 大多数非平凡的软件任务需要协调的阶段:理解需求、设计解决方案、并行实现、测试和验证质量。Autopilot自动编排所有这些阶段,使用户可以描述他们想要什么,并接收工作代码,而无需管理每个步骤。 </Why_This_Exists>
<Execution_Policy>
- 每个阶段必须在下一个开始前完成
- 在可能的情况下,在阶段内使用并行执行(第2阶段和第4阶段)
- QA循环最多重复5次;如果相同错误持续3次,停止并报告根本问题
- 验证需要所有审查者的批准;被拒绝的项目修复并重新验证
- 任何时候使用
/oh-my-claudecode:cancel取消;进度保存以便恢复 </Execution_Policy>
<Steps>
-
阶段0 - 扩展:将用户的想法转化为详细规范
- 分析师(Opus):提取需求
- 架构师(Opus):创建技术规范
- 输出:
.omc/autopilot/spec.md
-
阶段1 - 规划:从规范创建实施计划
- 架构师(Opus):创建计划(直接模式,无访谈)
- 批评者(Opus):验证计划
- 输出:
.omc/plans/autopilot-impl.md
-
阶段2 - 执行:使用Ralph + Ultrawork实施计划
- 执行器低(Haiku):简单任务
- 执行器(Sonnet):标准任务
- 执行器高(Opus):复杂任务
- 并行运行独立任务
-
阶段3 - QA:循环直到所有测试通过(UltraQA模式)
- 构建、lint、测试、修复失败
- 最多重复5个循环
- 如果相同错误重复3次,提前停止(表明根本问题)
-
阶段4 - 验证:并行多视角审查
- 架构师:功能完整性
- 安全审查员:漏洞检查
- 代码审查员:质量审查
- 所有必须批准;拒绝时修复并重新验证
-
阶段5 - 清理:成功完成后删除所有状态文件
- 删除
.omc/state/autopilot-state.json、ralph-state.json、ultrawork-state.json、ultraqa-state.json - 运行
/oh-my-claudecode:cancel进行干净退出 </Steps>
- 删除
<Tool_Usage>
- 在首次使用MCP工具前,调用
ToolSearch("mcp")以发现延迟的MCP工具 - 使用
ask_codex与agent_role: "architect"进行阶段4的架构验证 - 使用
ask_codex与agent_role: "security-reviewer"进行阶段4的安全审查 - 使用
ask_codex与agent_role: "code-reviewer"进行阶段4的质量审查 - 代理首先形成自己的分析,然后咨询Codex进行交叉验证
- 如果ToolSearch找不到MCP工具或Codex不可用,继续执行——永远不要因外部工具而阻塞 </Tool_Usage>
<Examples> <Good> 用户:“autopilot A REST API for a bookstore inventory with CRUD operations using TypeScript” 为什么好:特定领域(书店),明确功能(CRUD),技术约束(TypeScript)。Autopilot有足够的上下文扩展为完整规范。 </Good>
<Good> 用户:“build me a CLI tool that tracks daily habits with streak counting” 为什么好:清晰的产品概念,具有特定功能。“build me”触发激活autopilot。 </Good>
<Bad> 用户:“fix the bug in the login page” 为什么不好:这是一个单一的重点修复,不是多阶段项目。使用直接执行器委托或ralph代替。 </Bad>
<Bad> 用户:“what are some good approaches for adding caching?” 为什么不好:这是一个探索/头脑风暴请求。以对话方式回应或使用plan技能。 </Bad> </Examples>
<Escalation_And_Stop_Conditions>
- 当相同QA错误在3个循环中持续时,停止并报告(需要人工输入的根本问题)
- 当验证在3轮重新验证后仍失败时,停止并报告
- 当用户说“stop”、“cancel”或“abort”时停止
- 如果需求太模糊,扩展产生不明确的规范,暂停并在继续前向用户澄清 </Escalation_And_Stop_Conditions>
<Final_Checklist>
- [ ] 所有5个阶段完成(扩展、规划、执行、QA、验证)
- [ ] 阶段4中所有验证者批准
- [ ] 测试通过(用新测试运行输出验证)
- [ ] 构建成功(用新构建输出验证)
- [ ] 状态文件清理
- [ ] 用户被告知完成,并总结构建内容 </Final_Checklist>
<Advanced>
配置
可选设置在.claude/settings.json中:
{
"omc": {
"autopilot": {
"maxIterations": 10,
"maxQaCycles": 5,
"maxValidationRounds": 3,
"pauseAfterExpansion": false,
"pauseAfterPlanning": false,
"skipQa": false,
"skipValidation": false
}
}
}
恢复
如果autopilot被取消或失败,再次运行/oh-my-claudecode:autopilot以从停止处恢复。
输入最佳实践
- 具体领域——“书店”而非“商店”
- 提及关键功能——“with CRUD”、“with authentication”
- 指定约束——“using TypeScript”、“with PostgreSQL”
- 让它运行——除非真正需要,避免中断
故障排除
卡在某个阶段? 检查TODO列表以获取阻塞任务,审查.omc/autopilot-state.json,或取消并恢复。
QA循环耗尽? 相同错误3次表明根本问题。审查错误模式;可能需要人工干预。
验证持续失败? 审查具体问题。需求可能太模糊——取消并提供更多细节。 </Advanced>