name: verification-before-completion description: 在声称工作完成、修复或通过之前使用,需要在提交或创建PR之前运行验证命令并确认输出;始终先有证据再作断言
完成前验证
概述
未经验证就声称工作完成是不诚实,而非高效。
核心原则: 始终先有证据,再作断言。
违反此规则的字面意思就是违反其精神。
铁律
没有新的验证证据,不得声称完成
如果你没有运行本消息中的验证命令,就不能声称它通过了。
门控函数
在声称任何状态或表达满意之前:
1. 识别:什么命令能证明这个声称?
2. 运行:执行完整的命令(全新的、完整的)
3. 阅读:完整输出,检查退出代码,统计失败数
4. 验证:输出是否证实了声称?
- 如果否:用证据说明实际状态
- 如果是:用证据说明声称
5. 只有那时:才能作出声称
跳过任何一步 = 撒谎,而非验证
常见失败
| 声称 | 需要 | 不足够 |
|---|---|---|
| 测试通过 | 测试命令输出:0个失败 | 之前的运行,“应该通过” |
| 代码检查干净 | 代码检查输出:0个错误 | 部分检查,推断 |
| 构建成功 | 构建命令:退出代码 0 | 代码检查通过,日志看起来不错 |
| Bug已修复 | 测试原始症状:通过 | 代码已更改,假设已修复 |
| 回归测试有效 | 红绿循环已验证 | 测试通过一次 |
| 代理已完成 | VCS差异显示更改 | 代理报告“成功” |
| 需求已满足 | 逐项核对清单 | 测试通过 |
危险信号 - 停止
- 使用“应该”、“可能”、“似乎”
- 在验证前表达满意(“太好了!”、“完美!”、“完成!”等)
- 即将提交/推送/创建PR而未验证
- 信任代理的成功报告
- 依赖部分验证
- 想着“就这一次”
- 累了想结束工作
- 任何暗示成功但未运行验证的措辞
防止合理化
| 借口 | 现实 |
|---|---|
| “现在应该能工作了” | 运行验证 |
| “我有信心” | 信心 ≠ 证据 |
| “就这一次” | 没有例外 |
| “代码检查通过了” | 代码检查 ≠ 编译器 |
| “代理说成功了” | 独立验证 |
| “我累了” | 疲惫 ≠ 借口 |
| “部分检查就够了” | 部分证明不了什么 |
| “措辞不同所以规则不适用” | 精神重于字面 |
关键模式
测试:
✅ [运行测试命令] [看到:34/34 通过] “所有测试通过”
❌ “现在应该通过了” / “看起来正确”
回归测试(TDD 红绿循环):
✅ 编写 → 运行(通过)→ 撤销修复 → 运行(必须失败)→ 恢复 → 运行(通过)
❌ “我写了一个回归测试”(没有红绿验证)
构建:
✅ [运行构建] [看到:退出代码 0] “构建通过”
❌ “代码检查通过了”(代码检查不检查编译)
需求:
✅ 重读计划 → 创建核对清单 → 验证每一项 → 报告差距或完成情况
❌ “测试通过,阶段完成”
代理委托:
✅ 代理报告成功 → 检查VCS差异 → 验证更改 → 报告实际状态
❌ 信任代理报告
为何这很重要
来自24次失败记忆:
- 你的人类伙伴说“我不相信你”——信任破裂
- 未定义的函数被发布——会崩溃
- 缺失的需求被发布——功能不完整
- 时间浪费在虚假完成上 → 重定向 → 返工
- 违反:“诚实是核心价值。如果你撒谎,你将被替换。”
何时应用
总是在以下情况之前:
- 任何形式的成功/完成声称
- 任何满意表达
- 任何关于工作状态的积极陈述
- 提交、创建PR、任务完成
- 转向下一个任务
- 委托给代理
规则适用于:
- 确切短语
- 释义和同义词
- 成功的暗示
- 任何暗示完成/正确性的沟通
底线
验证没有捷径。
运行命令。阅读输出。然后声称结果。
这是不可协商的。