名称: tdd 描述: 测试驱动开发工作流程与哲学指南 - 计划 → 写测试 → 实现 → 验证 关键词: [tdd, 测试驱动, 测试优先, 红绿重构]
/tdd - 测试驱动开发工作流程
严格的TDD工作流程: 测试优先,然后实现。
何时使用
- “使用TDD实现X”
- “先测试再构建此功能”
- “为X写测试然后实现”
- 任何测试覆盖率至关重要的功能
- 需要回归测试的bug修复
TDD哲学
概述
先写测试。观察它失败。写最少的代码使其通过。
核心原则: 如果你没有观察测试失败,你就不知道它是否测试了正确的东西。
违反规则的字面就是违反规则的精神。
铁律
没有失败测试优先,就没有生产代码
先写代码再写测试?删除它。重新开始。
没有例外:
- 不要保留它作为"参考"
- 不要"调整"它而写测试
- 不要看它
- 删除意味着删除
从测试中全新实现。就这样。
红绿重构
红 - 写失败测试
写一个最小的测试,显示应该发生什么。
好:
test('重试失败操作3次', async () => {
let attempts = 0;
const operation = () => {
attempts++;
if (attempts < 3) throw new Error('失败');
return '成功';
};
const result = await retryOperation(operation);
expect(result).toBe('成功');
expect(attempts).toBe(3);
});
清晰的名称,测试真实行为,一件事。
坏:
test('重试工作', async () => {
const mock = jest.fn()
.mockRejectedValueOnce(new Error())
.mockResolvedValueOnce('成功');
await retryOperation(mock);
expect(mock).toHaveBeenCalledTimes(3);
});
模糊的名称,测试模拟而不是代码。
要求:
- 一个行为
- 清晰的名称
- 真实代码(除非不可避免,否则不要用模拟)
验证红 - 观察它失败
强制。从不跳过。
npm test path/to/test.test.ts
# 或
pytest path/to/test_file.py
确认:
- 测试失败(不是错误)
- 失败消息是预期的
- 失败是因为功能缺失(不是拼写错误)
测试通过? 你在测试现有行为。修复测试。 测试错误? 修复错误,重新运行直到它正确失败。
绿 - 最少的代码
写最简单的代码使测试通过。
好:
async function retryOperation<T>(fn: () => Promise<T>): Promise<T> {
for (let i = 0; i < 3; i++) {
try {
return await fn();
} catch (e) {
if (i === 2) throw e;
}
}
throw new Error('不可达');
}
仅足够通过。
坏:
async function retryOperation<T>(
fn: () => Promise<T>,
options?: {
maxRetries?: number;
backoff?: '线性' | '指数';
onRetry?: (attempt: number) => void;
}
): Promise<T> {
// YAGNI - 过度工程
}
不要添加功能、重构其他代码,或超越测试的"改进"。
验证绿 - 观察它通过
强制。
npm test path/to/test.test.ts
确认:
- 测试通过
- 其他测试仍然通过
- 输出纯净(没有错误、警告)
测试失败? 修复代码,不是测试。 其他测试失败? 立即修复。
重构 - 清理
仅在绿色之后:
- 移除重复
- 改进名称
- 提取辅助函数
保持测试绿色。不要添加行为。
常见合理化
| 借口 | 现实 |
|---|---|
| “太简单不用测试” | 简单代码也会坏。测试只需30秒。 |
| “我之后会测试” | 测试之后立即通过证明不了什么。 |
| “测试后实现目标相同” | 测试后 = “这做什么?” 测试优先 = “这应该做什么?” |
| “已经手动测试了” | 临时测试 ≠ 系统化。没有记录,不能重新运行。 |
| “删除X小时是浪费” | 沉没成本谬误。保留未验证的代码是技术债务。 |
| “保留为参考,先写测试” | 你会调整它。那就是测试后。删除意味着删除。 |
| “需要先探索” | 可以。丢掉探索,用TDD开始。 |
| “测试难 = 设计不清晰” | 倾听测试。难测试 = 难使用。 |
| “TDD会减慢速度” | TDD比调试快。务实 = 测试优先。 |
| “手动测试更快” | 手动不能证明边界情况。每次更改你都会重新测试。 |
红旗 - 停止并重新开始
- 代码在测试之前
- 测试在实现之后
- 测试立即通过
- 不能解释为什么测试失败
- 测试"后来"添加
- 合理化"就这一次"
- “我已经手动测试了”
- “测试后目标相同”
- “保留为参考"或"调整现有代码”
所有这些意味着: 删除代码。用TDD重新开始。
验证检查清单
在工作完成前:
- [ ] 每个新函数/方法都有测试
- [ ] 观察每个测试在实现前失败
- [ ] 每个测试因预期原因失败(功能缺失,不是拼写错误)
- [ ] 写了最少的代码使每个测试通过
- [ ] 所有测试通过
- [ ] 输出纯净(没有错误、警告)
- [ ] 测试使用真实代码(模拟仅在不可避免时使用)
- [ ] 边界情况和错误已覆盖
不能勾选所有框?你跳过了TDD。重新开始。
当卡住时
| 问题 | 解决方案 |
|---|---|
| 不知道如何测试 | 写希望的API。先写断言。询问你的人类伙伴。 |
| 测试太复杂 | 设计太复杂。简化接口。 |
| 必须模拟一切 | 代码耦合太强。使用依赖注入。 |
| 测试设置巨大 | 提取辅助函数。仍然复杂?简化设计。 |
工作流执行
工作流概述
┌────────────┐ ┌──────────┐ ┌──────────┐ ┌───────────┐
│ 计划- │───▶│ 仲裁者 │───▶│ 克拉克 │───▶│ 仲裁者 │
│ 代理 │ │ │ │ │ │ │
└────────────┘ └──────────┘ └──────────┘ └───────────┘
设计 写失败 实现最少 验证所有
方法 测试 代码 测试通过
代理序列
| # | 代理 | 角色 | 输出 |
|---|---|---|---|
| 1 | 计划代理 | 设计测试用例和实现方法 | 测试计划 |
| 2 | 仲裁者 | 写失败测试(红阶段) | 测试文件 |
| 3 | 克拉克 | 实现最少的代码通过(绿阶段) | 实现 |
| 4 | 仲裁者 | 运行所有测试,验证没有破坏 | 测试报告 |
核心原则
没有失败测试优先,就没有生产代码
每个代理遵循TDD契约:
- 仲裁者写测试必须初始失败
- 克拉克写最少的代码使测试通过
- 仲裁者确认整个套件通过
执行
阶段1: 计划测试用例
任务(
子代理类型="计划代理",
提示="""
设计TDD方法用于: [功能名称]
定义:
1. 需要测试的行为
2. 覆盖的边界情况
3. 预期的测试结构
不要写任何实现代码。
输出: 测试计划文档
"""
)
阶段2: 写失败测试(红)
任务(
子代理类型="仲裁者",
提示="""
写失败测试用于: [功能名称]
测试计划: [来自阶段1]
要求:
- 先写测试
- 运行测试确认它们失败
- 测试必须因功能缺失而失败(不是语法错误)
- 创建清晰的测试名称描述预期行为
不要写任何实现代码。
"""
)
阶段3: 实现(绿)
任务(
子代理类型="克拉克",
提示="""
实现最少的代码通过测试: [功能名称]
测试位置: [测试文件路径]
要求:
- 只写足够的代码使测试通过
- 除了测试要求的,不添加额外功能
- 没有"改进"或"增强"
- 每次更改后运行测试
严格遵守红绿重构。
"""
)
阶段4: 验证
任务(
子代理类型="仲裁者",
提示="""
验证TDD实现: [功能名称]
- 运行完整测试套件
- 验证所有新测试通过
- 验证没有现有测试破坏
- 如果可用,检查测试覆盖率
"""
)
TDD规则执行
- 仲裁者 不能写实现代码
- 克拉克 不能添加未测试的功能
- 测试必须在实现前失败
- 测试必须在实现后通过
示例
用户: /tdd 添加电子邮件验证到注册表单
Claude: 开始 /tdd 工作流用于电子邮件验证...
阶段1: 计划测试用例...
[生成计划代理]
测试计划:
- 有效电子邮件格式
- 无效电子邮件格式
- 拒绝空电子邮件
- 边界情况(Unicode、长电子邮件)
阶段2: 写失败测试(红)...
[生成仲裁者]
✅ 8个测试写入,所有按预期失败
阶段3: 实现最少的代码(绿)...
[生成克拉克]
✅ 所有8个测试现在通过
阶段4: 验证...
[生成仲裁者]
✅ 247个测试通过(8个新),0个失败
TDD工作流完成!
重构阶段(可选)
在绿之后,你可以添加重构阶段:
任务(
子代理类型="克拉克",
提示="""
重构: [功能名称]
- 清理代码同时保持测试绿色
- 移除重复
- 改进命名
- 如果需要,提取辅助函数
不要添加新行为。保持所有测试通过。
"""
)