名称: 并行代理调度 描述: 当面对2个或更多独立任务,这些任务可以在没有共享状态或顺序依赖的情况下工作时使用
并行代理调度
概述
当你有多个不相关的失败(不同的测试文件、不同的子系统、不同的错误)时,顺序调查它们会浪费时间。每个调查是独立的,可以并行进行。
核心原则: 每个独立问题领域派遣一个代理。让他们并发工作。
何时使用
digraph when_to_use {
"多个失败?" [shape=diamond];
"它们是独立的吗?" [shape=diamond];
"单个代理调查所有" [shape=box];
"每个问题领域一个代理" [shape=box];
"它们可以并行工作吗?" [shape=diamond];
"顺序代理" [shape=box];
"并行派遣" [shape=box];
"多个失败?" -> "它们是独立的吗?" [label="是"];
"它们是独立的吗?" -> "单个代理调查所有" [label="否 - 相关"];
"它们是独立的吗?" -> "它们可以并行工作吗?" [label="是"];
"它们可以并行工作吗?" -> "并行派遣" [label="是"];
"它们可以并行工作吗?" -> "顺序代理" [label="否 - 共享状态"];
}
使用时机:
- 3个或更多测试文件因不同根原因失败
- 多个子系统独立损坏
- 每个问题可以在没有其他上下文的情况下理解
- 调查之间没有共享状态
不要使用时机:
- 失败相关(修复一个可能修复其他)
- 需要理解完整系统状态
- 代理会相互干扰
模式
1. 识别独立领域
按损坏内容分组失败:
- 文件A测试:工具批准流程
- 文件B测试:批量完成行为
- 文件C测试:中止功能
每个领域是独立的 - 修复工具批准不影响中止测试。
2. 创建专注的代理任务
每个代理获得:
- 特定范围: 一个测试文件或子系统
- 明确目标: 使这些测试通过
- 约束: 不要更改其他代码
- 预期输出: 你发现和修复的内容摘要
3. 并行派遣
// 在Claude Code / AI环境中
Task("修复agent-tool-abort.test.ts失败")
Task("修复batch-completion-behavior.test.ts失败")
Task("修复tool-approval-race-conditions.test.ts失败")
// 所有三个同时运行
4. 审查和集成
当代理返回时:
- 阅读每个摘要
- 验证修复不冲突
- 运行完整测试套件
- 集成所有更改
代理提示结构
好的代理提示是:
- 专注的 - 一个清晰的问题领域
- 自包含的 - 理解问题所需的所有上下文
- 具体关于输出 - 代理应该返回什么?
修复src/agents/agent-tool-abort.test.ts中的3个失败测试:
1. "should abort tool with partial output capture" - 期望消息中有'interrupted at'
2. "should handle mixed completed and aborted tools" - 快速工具中止而不是完成
3. "should properly track pendingToolCount" - 期望3个结果但得到0
这些是时序/竞争条件问题。你的任务:
1. 阅读测试文件并理解每个测试验证什么
2. 识别根原因 - 时序问题或实际错误?
3. 通过以下方式修复:
- 用基于事件的等待替换任意超时
- 如果找到,修复中止实现中的错误
- 如果测试行为改变,调整测试期望
不要只是增加超时 - 找到真正的问题。
返回:你发现和修复的内容摘要。
常见错误
❌ 太宽泛: “修复所有测试” - 代理迷失 ✅ 具体: “修复agent-tool-abort.test.ts” - 专注范围
❌ 无上下文: “修复竞争条件” - 代理不知道哪里 ✅ 上下文: 粘贴错误消息和测试名称
❌ 无约束: 代理可能重构所有内容 ✅ 约束: “不要更改生产代码” 或 “仅修复测试”
❌ 模糊输出: “修复它” - 你不知道改变了什么 ✅ 具体: “返回根原因和更改摘要”
何时不使用
相关失败: 修复一个可能修复其他 - 先一起调查 需要完整上下文: 理解需要看到整个系统 探索性调试: 你还不清楚什么坏了 共享状态: 代理会干扰(编辑相同文件、使用相同资源)
真实示例来自会话
场景: 主要重构后,3个文件中有6个测试失败
失败:
- agent-tool-abort.test.ts: 3个失败(时序问题)
- batch-completion-behavior.test.ts: 2个失败(工具未执行)
- tool-approval-race-conditions.test.ts: 1个失败(执行计数 = 0)
决策: 独立领域 - 中止逻辑独立于批量完成,独立于竞争条件
派遣:
代理1 → 修复agent-tool-abort.test.ts
代理2 → 修复batch-completion-behavior.test.ts
代理3 → 修复tool-approval-race-conditions.test.ts
结果:
- 代理1:用基于事件的等待替换超时
- 代理2:修复事件结构错误(threadId位置错误)
- 代理3:添加等待异步工具执行完成
集成: 所有修复独立,无冲突,完整套件绿色
时间节省: 3个问题并行解决 vs 顺序解决
关键好处
- 并行化 - 多个调查同时进行
- 专注 - 每个代理范围窄,跟踪上下文少
- 独立性 - 代理不相互干扰
- 速度 - 3个问题在1个问题的时间内解决
验证
代理返回后:
- 审查每个摘要 - 理解改变了什么
- 检查冲突 - 代理是否编辑了相同代码?
- 运行完整套件 - 验证所有修复一起工作
- 抽查 - 代理可能犯系统性错误
实际影响
从调试会话(2025-10-03):
- 3个文件中有6个失败
- 3个代理并行派遣
- 所有调查同时完成
- 所有修复成功集成
- 代理更改之间零冲突