name: 评估工具集更新器 description: 刷新评估工具集,以在不可靠环境下保持实时和回退解析器的可靠性、SLO门控和回归检查。 version: 1.0.0 model: sonnet invoked_by: both user_invocable: true tools: [读, 写, 编辑, 通配符搜索, 全局搜索, Bash, 技能, 记忆记录, 网络搜索, 网络获取] args: ‘–harness <路径或名称> [–trigger 反思|进化|手动]’ error_handling: graceful streaming: supported verified: false lastVerifiedAt: 2026-02-19T05:29:09.098Z
评估工具集更新器
刷新评估工具集,以在不可靠环境下保持实时 + 回退模式的可操作性。
重点领域
- 提示和解析器漂移
- 超时/部分流处理
- SLO 和回归门控
- 双运行回退一致性
工作流程
- 解析工具集路径。
- 研究测试/评估最佳实践。
- 为解析和超时边缘情况添加 RED 回归。
- 修补最小工具集逻辑。
- 验证评估输出和 CI 门控。