name: dispatching-parallel-agents description: 在面对3个以上独立故障时使用,这些故障可以在没有共享状态或依赖的情况下调查 - 调度多个Claude代理并发调查和修复独立问题
并行代理调度
概述
当你有多个不相关的故障(不同的测试文件、不同的子系统、不同的错误)时,顺序调查它们会浪费时间。每个调查都是独立的,可以并行进行。
核心原则: 为每个独立问题域调度一个代理。让它们并发工作。
何时使用
digraph when_to_use {
"Multiple failures?" [shape=diamond];
"Are they independent?" [shape=diamond];
"Single agent investigates all" [shape=box];
"One agent per problem domain" [shape=box];
"Can they work in parallel?" [shape=diamond];
"Sequential agents" [shape=box];
"Parallel dispatch" [shape=box];
"Multiple failures?" -> "Are they independent?" [label="yes"];
"Are they independent?" -> "Single agent investigates all" [label="no - related"];
"Are they independent?" -> "Can they work in parallel?" [label="yes"];
"Can they work in parallel?" -> "Parallel dispatch" [label="yes"];
"Can they work in parallel?" -> "Sequential agents" [label="no - shared state"];
}
使用时:
- 3个以上测试文件因不同根本原因失败
- 多个子系统独立损坏
- 每个问题无需其他上下文即可理解
- 调查之间无共享状态
不要使用时:
- 故障相关(修复一个可能修复其他)
- 需要理解完整系统状态
- 代理会相互干扰
模式
1. 识别独立域
按损坏部分分组故障:
- 文件A测试:工具批准流程
- 文件B测试:批处理完成行为
- 文件C测试:中止功能
每个域是独立的 - 修复工具批准不影响中止测试。
2. 创建专注的代理任务
每个代理获得:
- 特定范围: 一个测试文件或子系统
- 明确目标: 使这些测试通过
- 约束: 不要更改其他代码
- 预期输出: 发现和修复内容的摘要
3. 并行调度
// 在Claude代码 / AI环境中
Task("Fix agent-tool-abort.test.ts failures")
Task("Fix batch-completion-behavior.test.ts failures")
Task("Fix tool-approval-race-conditions.test.ts failures")
// 所有三个并发运行
4. 审核和集成
当代理返回时:
- 阅读每个摘要
- 验证修复不冲突
- 运行完整测试套件
- 集成所有更改
代理提示结构
好的代理提示是:
- 专注的 - 一个清晰的问题域
- 自包含的 - 理解问题所需的所有上下文
- 输出具体 - 代理应返回什么?
修复src/agents/agent-tool-abort.test.ts中的3个失败测试:
1. "should abort tool with partial output capture" - 预期消息中包含'interrupted at'
2. "should handle mixed completed and aborted tools" - 快速工具中止而不是完成
3. "should properly track pendingToolCount" - 预期3个结果但得到0
这些是时序/竞态条件问题。你的任务:
1. 阅读测试文件并理解每个测试验证什么
2. 识别根本原因 - 时序问题还是实际错误?
3. 修复:
- 将任意超时替换为基于事件的等待
- 如果发现,修复中止实现中的错误
- 如果测试行为改变,调整测试预期
不要仅增加超时 - 找到真正的问题。
返回:发现和修复内容的摘要。
常见错误
❌ 太宽泛: “修复所有测试” - 代理迷失方向 ✅ 具体: “修复agent-tool-abort.test.ts” - 专注范围
❌ 无上下文: “修复竞态条件” - 代理不知道在哪里 ✅ 上下文: 粘贴错误消息和测试名称
❌ 无约束: 代理可能重构一切 ✅ 约束: “不要更改生产代码”或“仅修复测试”
❌ 模糊输出: “修复它” - 你不知道改变了什么 ✅ 具体: “返回根本原因和更改的摘要”
何时不使用
相关故障: 修复一个可能修复其他 - 首先一起调查 需要完整上下文: 理解需要看到整个系统 探索性调试: 你还不清楚损坏了什么 共享状态: 代理会相互干扰(编辑相同文件,使用相同资源)
会话真实示例
场景: 大重构后,3个文件中的6个测试失败
故障:
- agent-tool-abort.test.ts: 3个失败(时序问题)
- batch-completion-behavior.test.ts: 2个失败(工具未执行)
- tool-approval-race-conditions.test.ts: 1个失败(执行计数 = 0)
决策: 独立域 - 中止逻辑与批处理完成独立,与竞态条件独立
调度:
Agent 1 → Fix agent-tool-abort.test.ts
Agent 2 → Fix batch-completion-behavior.test.ts
Agent 3 → Fix tool-approval-race-conditions.test.ts
结果:
- 代理1:将超时替换为基于事件的等待
- 代理2:修复了事件结构错误(threadId位置错误)
- 代理3:添加等待异步工具执行完成
集成: 所有修复独立,无冲突,完整套件通过
节省时间: 并行解决3个问题 vs 顺序
关键好处
- 并行化 - 多个调查同时进行
- 专注 - 每个代理范围窄,跟踪上下文少
- 独立性 - 代理不相互干扰
- 速度 - 在时间内解决3个问题
验证
代理返回后:
- 审核每个摘要 - 理解改变了什么
- 检查冲突 - 代理是否编辑了相同代码?
- 运行完整套件 - 验证所有修复协同工作
- 抽查 - 代理可能犯系统性错误
真实世界影响
来自调试会话(2025-10-03):
- 3个文件中的6个失败
- 3个代理并行调度
- 所有调查同时完成
- 所有修复成功集成
- 代理更改之间零冲突