name: testing description: 全面的测试专项技能,涵盖测试策略、自动化、TDD方法论、测试编写和Web应用测试。适用于设置测试基础设施、编写测试、实施TDD工作流、分析覆盖率、将测试集成到CI/CD中,或使用Playwright测试Web应用程序。采用框架无关的方法,并通过参考文件提供特定框架的指导。 author: Joseph OBrien status: unpublished updated: ‘2025-12-23’ version: 1.0.1 tag: skill type: skill
测试
此技能提供全面的测试能力,包括测试策略、自动化设置、测试驱动开发(TDD)、测试编写最佳实践、覆盖率分析、CI/CD集成以及使用Playwright进行Web应用程序测试。
何时使用此技能
- 为项目设置测试基础设施时
- 创建测试策略和测试计划时
- 编写单元、集成或端到端测试时
- 实施TDD/测试优先开发时
- 分析测试覆盖率和质量时
- 将测试集成到CI/CD流水线时
- 使用Playwright测试Web应用程序时
- 调试测试失败或提高测试可靠性时
- 编写测试夹具、模拟数据或工厂函数时
- 模拟外部依赖(API、数据库、文件系统)时
- 组织测试文件结构和测试套件时
- 测试异步代码、Promise或事件驱动行为时
- 为UI组件实施快照测试时
- 配置测试覆盖率阈值时
此技能的作用
- 测试策略:设计全面的测试策略(单元、集成、端到端)
- 测试自动化:设置测试框架和自动化工具
- TDD方法论:实施测试驱动开发工作流(红-绿-重构)
- 测试编写:编写专注、可维护的测试,并采用正确的模式
- 覆盖率分析:分析和改进测试覆盖率
- CI/CD集成:将测试集成到持续集成流水线中
- Web应用测试:使用Playwright测试Web应用程序
- 测试质量:提高测试的可靠性和可维护性
测试策略
测试金字塔
推荐分布:
- 单元测试:70% - 快速、隔离,测试单个函数
- 集成测试:20% - 测试组件交互
- 端到端测试:10% - 测试完整的用户工作流
测试类型:
- 功能测试(正常路径、边界情况、错误处理)
- 非功能测试(性能、安全、可访问性)
- 回归测试(防止破坏性变更)
- 冒烟测试(关键路径验证)
框架选择
JavaScript/TypeScript:
- Jest、Vitest、Mocha用于单元/集成测试
- Playwright、Cypress用于端到端测试
- React Testing Library用于组件测试
Python:
- pytest用于单元/集成测试
- Selenium、Playwright用于端到端测试
- unittest用于标准库测试
Java:
- JUnit用于单元测试
- TestNG用于集成测试
- Selenium用于端到端测试
Go:
- 内置测试包
- Testify用于断言
Rust:
- 内置测试框架
- Cargo test用于运行测试
测试驱动开发(TDD)
TDD是一种设计技术,而不仅仅是测试技术。它通过小而规范的步骤产生设计更好、更易维护的代码。
核心原则
先写测试,后写代码。始终如此。 TDD迫使你思考:
- 我需要什么行为?
- 我怎么知道它有效?
- 最简单的实现是什么?
三大定律(永不违反)
- 不编写生产代码,除非先有一个失败的测试
- 只编写足够的测试来证明一个失败
- 只编写足够的代码来通过该测试
红-绿-重构循环
阶段1:红 - 编写失败的测试
- 编写一个定义所需行为的测试
- 运行测试 - 验证它失败
- 验证它因正确的原因失败(不是语法错误)
- 不要编写实现代码
阶段2:绿 - 最小化实现
- 编写最少的代码使测试通过
- 抵制添加额外功能的冲动
- 运行测试 - 验证它通过
- 如果测试仍然失败,修复实现(而不是测试)
阶段3:重构 - 清理代码
- 消除代码重复(DRY原则)
- 改进命名以提高清晰度
- 将复杂逻辑提取到函数中
- 运行所有测试 - 必须始终保持通过
- 检查更改行的测试覆盖率
重构之后,为下一个行为开始新的红阶段。
测试编写模式
准备-执行-断言(AAA)
结构:
- 准备:设置测试数据和条件
- 执行:执行被测试的代码
- 断言:验证预期结果
示例:
describe('用户服务', () => {
it('应使用有效数据创建用户', async () => {
// 准备
const userData = { email: 'test@example.com', name: '测试用户' };
// 执行
const result = await userService.createUser(userData);
// 断言
expect(result).toHaveProperty('id');
expect(result.email).toBe(userData.email);
});
});
给定-当-那么(BDD风格)
结构:
- 给定:初始上下文/先决条件
- 当:触发行为的动作/事件
- 那么:预期结果
测试组织
文件结构:
项目/
├── src/
│ └── components/
│ └── User.jsx
├── tests/
│ ├── unit/
│ │ └── User.test.jsx
│ ├── integration/
│ │ └── UserAPI.test.js
│ └── e2e/
│ └── user-flow.spec.js
├── jest.config.js
└── playwright.config.js
覆盖率分析
覆盖率目标
推荐阈值:
- 行覆盖率:80%+
- 函数覆盖率:80%+
- 分支覆盖率:80%+
- 语句覆盖率:80%+
关键路径:
- 关键业务逻辑始终追求100%覆盖率
- 身份验证和授权
- 支付处理
- 数据验证
覆盖率缺口
常见缺口:
- 错误处理路径
- 边界情况
- 边界条件
- 集成点
改进策略:
- 识别未测试的代码路径
- 为错误场景添加测试
- 测试边界情况和边界条件
- 提高集成测试覆盖率
CI/CD集成
测试流水线
阶段:
- 单元测试:快速反馈,每次提交时运行
- 集成测试:在拉取请求时运行
- 端到端测试:在合并到主分支前运行
- 性能测试:在主分支上运行
质量门禁:
- 所有测试必须通过
- 覆盖率必须达到阈值
- 无关键安全问题
- 性能基准达标
使用Playwright进行Web应用程序测试
辅助脚本
此技能在scripts/目录中包含Python辅助脚本:
-
with_server.py- 管理服务器生命周期(支持多个服务器)。始终先使用--help查看用法。# 单服务器 python scripts/with_server.py --server "npm run dev" --port 5173 -- python your_automation.py # 多服务器(例如,后端 + 前端) python scripts/with_server.py \ --server "cd backend && python server.py" --port 3000 \ --server "cd frontend && npm run dev" --port 5173 \ -- python your_automation.py
决策树:选择你的方法
用户任务 → 是静态HTML吗?
├─ 是 → 直接读取HTML文件以识别选择器
│ ├─ 成功 → 使用选择器编写Playwright脚本
│ └─ 失败/不完整 → 视为动态应用(如下)
│
└─ 否(动态Web应用) → 服务器是否已在运行?
├─ 否 → 运行:python scripts/with_server.py --help
│ 然后使用辅助脚本 + 编写简化的Playwright脚本
│
└─ 是 → 先侦察后行动:
1. 导航并等待网络空闲
2. 截图或检查DOM
3. 从渲染状态识别选择器
4. 使用发现的选择器执行操作
Playwright最佳实践
- 将捆绑的脚本视为黑盒 - 使用
--help查看用法,然后直接调用 - 使用
sync_playwright()进行同步脚本 - 完成后始终关闭浏览器
- 使用描述性选择器:
text=、role=、CSS选择器或ID - 添加适当的等待:
page.wait_for_selector()或page.wait_for_timeout() - 关键:在动态应用上检查前等待
page.wait_for_load_state('networkidle')
示例:基本Playwright脚本
from playwright.sync_api import sync_playwright
with sync_playwright() as p:
browser = p.chromium.launch(headless=True)
page = browser.new_page()
page.goto('http://localhost:5173')
page.wait_for_load_state('networkidle') # 关键:等待JS执行
# ... 你的自动化逻辑
browser.close()
示例
查看examples/目录中的示例:
element_discovery.py- 在页面上发现按钮、链接和输入框static_html_automation.py- 使用file:// URL处理本地HTMLconsole_logging.py- 在自动化过程中捕获控制台日志
参考文件
如需详细的测试模式和工作流,请根据需要加载参考文件:
references/framework_workflows.md- 针对Python(pytest)、JavaScript(Jest、Vitest)、Java(JUnit)、Go、Rust的框架特定TDD工作流和示例references/test_patterns.md- 常见测试模式、测试组织、命名约定、测试替身(模拟、存根、间谍)、参数化和反模式references/webapp_testing.md- Web应用程序测试模式、Playwright最佳实践和端到端测试策略references/TESTING_REPORT.template.md- 测试质量报告模板,包含覆盖率指标、审计发现和建议
当处理特定框架或需要详细模式时,加载相应的参考文件。
最佳实践
测试质量
- 隔离性:测试应独立且可以按任何顺序运行
- 确定性:测试应产生一致的结果
- 快速性:单元测试应快速运行(每个< 100毫秒)
- 清晰性:测试名称应描述它们测试的内容
- 可维护性:当代码更改时,测试应易于更新
TDD最佳实践
- 每个测试一个行为:每个测试验证一个行为
- 描述性名称:测试名称描述被测试的行为
- 独立测试:测试不相互依赖
- 快速测试:模拟外部依赖以保持测试快速
- 清晰断言:断言清楚地显示正在验证的内容
应避免的常见错误
- ❌ 一次编写多个测试(一次编写一个测试)
- ❌ 跳过重构阶段(在绿阶段后始终重构)
- ❌ 在测试之前编写实现(删除代码并从测试开始)
- ❌ 在绿阶段过度设计(通过测试的最简单实现)
- ❌ 编写立即通过的测试(必须先失败)
测试维护
- 当需求变化时,审查和更新测试
- 移除过时的测试
- 重构测试以减少重复
- 保持测试数据工厂更新
- 监控测试执行时间
与其他技能的集成
- debugging:当测试意外失败时使用
- code-review:TDD产生的代码更易于审查
- dead-code-removal:测试有助于识别未使用的代码
- performance:用于性能测试策略
元原则
TDD是一种设计技术,而不是测试技术。
循环永不改变:红 → 绿 → 重构 → 重复
先写测试迫使你思考:
- 我需要什么行为?
- 我怎么知道它有效?
- 最简单的实现是什么?
这会产生设计更好、更易维护的代码。