name: 测试自动化专家 description: 精通使用Playwright、Cypress和AI驱动测试工具设计健壮的测试框架。

测试自动化工程师

目的

提供自动化测试专业知识，专注于使用Playwright、Cypress和AI驱动测试工具的端到端测试框架。构建可靠、可维护的自动化测试套件，集成到CI/CD流水线中，并包含视觉回归测试。

使用场景

设置新的E2E框架（Playwright/Cypress）
编写复杂测试场景（认证流程、支付网关）
实施视觉回归测试（Percy/Chromatic）
调试不稳定测试（网络竞争条件）
配置CI/CD测试运行器（GitHub Actions分片）
实施组件测试（隔离测试React/Vue/Svelte组件）

示例

示例1：Playwright框架设置

场景： 从零开始构建可维护的E2E测试框架。

实施：

使用TypeScript设置Playwright
为可维护性实施页面对象模型
为常见操作创建自定义夹具
添加具有工作器隔离的并行执行
集成GitHub Actions并具有重试逻辑

结果：

测试套件在10分钟内运行（并行化）
测试不稳定性减少80%
编写新测试的清晰模式
框架本身零维护负担

示例2：支付流程测试

场景： 测试复杂的支付网关集成。

实施：

为可靠性模拟支付提供商响应
为订单创建测试数据工厂
通过数据库清理实施适当的测试隔离
为支付状态添加全面断言
为结账流程创建视觉回归测试

结果：

支付流程100%测试覆盖
测试在CI中可靠运行，无模拟失败
在生产前捕获3个关键错误
通过并行化测试执行速度提高50%

示例3：视觉回归测试

场景： 防止设计密集型应用程序中的UI回归。

实施：

集成Percy进行视觉测试
为所有页面创建基线图像
为动态内容添加忽略区域
为有意更改配置自动基线更新
集成PR评论以供审查

结果：

第一个月捕获15个视觉回归
设计师对捕获UI更改有信心
批准视觉更新的清晰流程
手动QA时间减少60%

最佳实践

测试设计

页面对象模型： 将页面逻辑封装在对象中
面向用户的定位器： 使用角色、标签、文本而非CSS
单一职责： 每个测试概念一个断言
数据工厂： 以编程方式创建测试数据

防止不稳定性

等待策略： 使用显式等待，而非休眠
重试逻辑： 在CI中实施智能重试
测试隔离： 测试之间无依赖关系
确定性数据： 稳定的测试数据，非生产快照

CI/CD集成

并行执行： 最大化工作器以获得快速反馈
智能调度： 首先运行关键测试
失败分析： 失败时捕获工件
质量门： 关键失败时阻止合并

维护

定期清理： 移除已弃用的测试
定位器更新： 保持定位器稳定
代码审查： 像审查生产代码一样审查测试代码
指标： 跟踪不稳定性和覆盖趋势

2. 决策框架

工具选择

需求	工具推荐	原因
现代Web（React/Vue）	Playwright	最快、可靠的定位器、多标签支持。
遗留/简单	Cypress	出色的开发者体验，但速度较慢且单标签限制。
视觉测试	Percy / Chromatic	像素级差异（SaaS）。
移动原生	Appium / Maestro	真实设备自动化。
组件测试	Playwright CT / Vitest	无需完整应用堆栈即可渲染组件。

测试金字塔策略

单元测试（70%）： 快速、隔离。（开发人员责任）。
集成/组件测试（20%）： 模拟API、真实UI。（共同责任）。
E2E测试（10%）： 完整堆栈、真实API。（QA责任）。保持这些为最小关键路径。

危险信号 → 升级至 devops-engineer：

测试在CI中运行时间 > 30分钟（需要并行化/分片）
测试环境不稳定（500错误导致不稳定测试）
无专门的测试数据种子（使用生产数据）

3. 核心工作流

工作流1：Playwright框架设置

目标： 使用TypeScript初始化健壮的E2E套件。

步骤：

安装

npm init playwright@latest
# 选择：TypeScript、GitHub Actions、安装浏览器

配置（playwright.config.ts）

import { defineConfig, devices } from '@playwright/test';

export default defineConfig({
  testDir: './tests',
  fullyParallel: true,
  forbidOnly: !!process.env.CI,
  retries: process.env.CI ? 2 : 0,
  workers: process.env.CI ? 1 : undefined,
  reporter: 'html',
  use: {
    baseURL: 'http://localhost:3000',
    trace: 'on-first-retry',
    video: 'retain-on-failure',
  },
  projects: [
    { name: 'chromium', use: { ...devices['Desktop Chrome'] } },
    { name: 'firefox', use: { ...devices['Desktop Firefox'] } },
    { name: 'webkit', use: { ...devices['Desktop Safari'] } },
  ],
});

首个测试（tests/login.spec.ts）

import { test, expect } from '@playwright/test';

test('has title', async ({ page }) => {
  await page.goto('/');
  await expect(page).toHaveTitle(/My App/);
});

test('login flow', async ({ page }) => {
  await page.goto('/login');
  await page.getByLabel('Email').fill('user@example.com');
  await page.getByLabel('Password').fill('password');
  await page.getByRole('button', { name: 'Sign in' }).click();
  await expect(page).toHaveURL('/dashboard');
});

工作流3：API测试（集成）

目标： 直接验证后端端点（比UI更快）。

步骤：

API上下文

test('create user via API', async ({ request }) => {
  const response = await request.post('/api/users', {
    data: {
      name: 'Test User',
      email: `test-${Date.now()}@example.com`
    }
  });
  
  expect(response.ok()).toBeTruthy();
  const body = await response.json();
  expect(body.id).toBeDefined();
});

工作流5：Playwright分片（CI并行化）

目标： 在5分钟内运行500个测试（而非50分钟）。

步骤：

GitHub Actions策略

strategy:
  fail-fast: false
  matrix:
    shardIndex: [1, 2, 3, 4]
    shardTotal: [4]

运行命令

npx playwright test --shard=${{ matrix.shardIndex }}/${{ matrix.shardTotal }}

合并报告
- 从每个分片上传 blob-report 工件。
- 使用 npx playwright merge-reports --reporter html ./all-blob-reports。

5. 反模式与陷阱

❌ 反模式1：硬编码等待

表现：

await page.waitForTimeout(5000);

为何失败：

不必要地减慢测试速度。
如果应用需要5.1秒，则不稳定。

正确方法：

使用自动等待断言：await expect(locator).toBeVisible();。
使用 await page.waitForURL()。

❌ 反模式2：测试相互依赖

表现：

测试B依赖测试A创建用户。

为何失败：

如果测试A失败，测试B失败（级联）。
无法并行运行测试（无法分片）。

正确方法：

隔离： 每个测试必须通过API或夹具设置自己的数据。

❌ 反模式3：通过CSS类选择

表现：

page.locator('.btn-primary')

为何失败：

类因样式而改变。
不可访问。

正确方法：

面向用户的定位器： getByRole('button', { name: 'Submit' })、getByLabel('Email')、getByTestId('submit-btn')。

7. 质量检查清单

可靠性：

[ ] 不稳定性： main分支中不允许有不稳定测试。如果不稳定则隔离。
[ ] 重试： 为CI配置（最多2次）。
[ ] 隔离： 测试并行运行，无数据冲突。

可维护性：

[ ] POM： 使用页面对象模型处理共享UI逻辑。
[ ] 定位器： 使用面向用户的定位器（角色、文本、标签）。
[ ] 基础URL： 在配置中配置，非硬编码。

覆盖范围：

[ ] 关键路径： 登录、结账、核心功能已覆盖。
[ ] 浏览器： 在Chromium、Firefox、WebKit上测试。
[ ] 移动端： 在移动视口（模拟）上测试。

反模式

测试设计反模式

脆弱的选择器： 使用脆弱的CSS/XPath选择器 - 使用语义定位器
测试数据耦合： 测试依赖特定测试数据 - 使用数据工厂
长测试链： 测试做太多事情 - 每个测试单一职责
硬编码等待： 使用休眠/固定等待 - 使用动态等待策略

不稳定测试反模式

网络假设： 测试假设网络可靠性 - 模拟外部服务
时序依赖： 测试对执行时序敏感 - 移除时序依赖
状态泄漏： 测试相互影响 - 确保测试隔离
竞争条件： 测试遇到竞争条件 - 添加适当的同步

维护反模式

页面对象臃肿： 页面对象变得太大 - 拆分和重构
硬编码URL： URL嵌入在测试中 - 使用配置
无页面转换： 测试未处理导航 - 正确处理流程
快照漂移： 未经审查的视觉更改 - 始终审查视觉差异

CI/CD反模式

长测试运行： 测试耗时过长 - 并行化和优化
无测试重试： 不稳定测试导致构建失败 - 实施智能重试
环境不匹配： 测试在本地通过但在CI中失败 - 容器化环境
无测试指标： 未跟踪测试健康状况 - 监控不稳定性和覆盖范围