验证与质量保证技能Skill "Verification&QualityAssurance"

这是一个全面的验证和质量保证系统,用于确保代码质量、正确性和可靠性,包括实时真相评分、自动验证检查、自动回滚功能,集成CI/CD,适用于软件开发中的测试和质量控制。关键词:验证、质量保证、代码质量、真相评分、自动回滚、CI/CD、测试。

测试 0 次安装 0 次浏览 更新于 3/9/2026

name: “验证与质量保证” description: “全面的真相评分、代码质量验证和自动回滚系统,准确度阈值为0.95,用于确保高质量代理输出和代码库可靠性。” version: “2.0.0” category: “quality-assurance” tags: [“verification”, “truth-scoring”, “quality”, “rollback”, “metrics”, “ci-cd”]

验证与质量保证技能

这个技能的作用

这个技能提供了一个全面的验证和质量保证系统,通过以下方式确保代码质量和正确性:

  • 真相评分:代码、代理和任务的实时可靠性指标(0.0-1.0 比例)
  • 验证检查:自动代码正确性、安全性和最佳实践验证
  • 自动回滚:立即回滚未通过验证的更改(默认阈值:0.95)
  • 质量指标:带趋势、置信区间和改进跟踪的统计分析
  • CI/CD 集成:持续集成流水线的导出功能
  • 实时监控:用于持续验证的实时仪表板和观察模式

先决条件

  • 已安装 Claude Flow(npx claude-flow@alpha
  • Git 仓库(用于回滚功能)
  • Node.js 18+(用于仪表板功能)

快速开始

# 查看当前真相分数
npx claude-flow@alpha truth

# 运行验证检查
npx claude-flow@alpha verify check

# 使用自定义阈值验证特定文件
npx claude-flow@alpha verify check --file src/app.js --threshold 0.98

# 回滚上次失败的验证
npx claude-flow@alpha verify rollback --last-good

完整指南

真相评分系统

查看真相指标

显示代码库和代理任务的全面质量和可靠性指标。

基本用法:

# 查看当前真相分数(默认:表格格式)
npx claude-flow@alpha truth

# 查看特定时间段的分数
npx claude-flow@alpha truth --period 7d

# 查看特定代理的分数
npx claude-flow@alpha truth --agent coder --period 24h

# 查找低于阈值的文件/任务
npx claude-flow@alpha truth --threshold 0.8

输出格式:

# 表格格式(默认)
npx claude-flow@alpha truth --format table

# JSON 用于编程访问
npx claude-flow@alpha truth --format json

# CSV 用于电子表格分析
npx claude-flow@alpha truth --format csv

# 带可视化的 HTML 报告
npx claude-flow@alpha truth --format html --export report.html

实时监控:

# 观察模式带实时更新
npx claude-flow@alpha truth --watch

# 自动导出指标
npx claude-flow@alpha truth --export .claude-flow/metrics/truth-$(date +%Y%m%d).json

真相分数仪表板

示例仪表板输出:

📊 真相指标仪表板
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

总体真相分数:0.947 ✅
趋势:↗️ +2.3% (7d)

表现最佳者:
  verification-agent   0.982 ⭐
  code-analyzer       0.971 ⭐
  test-generator      0.958 ✅

需关注者:
  refactor-agent      0.821 ⚠️
  docs-generator      0.794 ⚠️

最近任务:
  task-456  0.991 ✅  "实施认证"
  task-455  0.967 ✅  "添加测试"
  task-454  0.743 ❌  "重构 API"

指标解释

真相分数(0.0-1.0):

  • 1.0-0.95:优秀 ⭐(生产就绪)
  • 0.94-0.85:良好 ✅(可接受质量)
  • 0.84-0.75:警告 ⚠️(需要关注)
  • <0.75:严重 ❌(需要立即行动)

趋势指示器:

  • ↗️ 改善(积极趋势)
  • → 稳定(一致表现)
  • ↘️ 下降(检测到质量回归)

统计:

  • 平均分数:所有测量的平均真相分数
  • 中位数分数:中间值(较少受异常值影响)
  • 标准差:分数的一致性(越低越一致)
  • 置信区间:测量的统计可靠性

验证检查

运行验证

对代码、任务或代理输出执行全面的验证检查。

文件验证:

# 验证单个文件
npx claude-flow@alpha verify check --file src/app.js

# 递归验证目录
npx claude-flow@alpha verify check --directory src/

# 启用自动修复验证
npx claude-flow@alpha verify check --file src/utils.js --auto-fix

# 验证当前工作目录
npx claude-flow@alpha verify check

任务验证:

# 验证特定任务输出
npx claude-flow@alpha verify check --task task-123

# 使用自定义阈值验证
npx claude-flow@alpha verify check --task task-456 --threshold 0.99

# 详细输出用于调试
npx claude-flow@alpha verify check --task task-789 --verbose

批量验证:

# 并行验证多个文件
npx claude-flow@alpha verify batch --files "*.js" --parallel

# 使用模式匹配验证
npx claude-flow@alpha verify batch --pattern "src/**/*.ts"

# 集成测试套件
npx claude-flow@alpha verify integration --test-suite full

验证标准

验证系统评估:

  1. 代码正确性

    • 语法验证
    • 类型检查(TypeScript)
    • 逻辑流分析
    • 错误处理完整性
  2. 最佳实践

    • 代码风格遵守
    • SOLID 原则
    • 设计模式使用
    • 模块化和可重用性
  3. 安全性

    • 漏洞扫描
    • 秘密检测
    • 输入验证
    • 认证/授权检查
  4. 性能

    • 算法复杂度
    • 内存使用模式
    • 数据库查询优化
    • 包大小影响
  5. 文档

    • JSDoc/TypeDoc 完整性
    • README 准确性
    • API 文档
    • 代码注释质量

用于 CI/CD 的 JSON 输出

# 获取结构化 JSON 输出
npx claude-flow@alpha verify check --json > verification.json

# 示例 JSON 结构:
{
  "overallScore": 0.947,
  "passed": true,
  "threshold": 0.95,
  "checks": [
    {
      "name": "code-correctness",
      "score": 0.98,
      "passed": true
    },
    {
      "name": "security",
      "score": 0.91,
      "passed": false,
      "issues": [...]
    }
  ]
}

自动回滚

回滚失败的更改

自动回滚未通过验证检查的更改。

基本回滚:

# 回滚到最后已知良好状态
npx claude-flow@alpha verify rollback --last-good

# 回滚到特定提交
npx claude-flow@alpha verify rollback --to-commit abc123

# 带预览的交互式回滚
npx claude-flow@alpha verify rollback --interactive

智能回滚:

# 仅回滚失败的文件(保留良好更改)
npx claude-flow@alpha verify rollback --selective

# 带自动备份回滚
npx claude-flow@alpha verify rollback --backup-first

# 干运行模式(预览而不执行)
npx claude-flow@alpha verify rollback --dry-run

回滚性能:

  • 基于 Git 的回滚:<1 秒
  • 选择性文件回滚:<500 毫秒
  • 备份创建:回滚前自动

验证报告

生成报告

创建带指标和可视化的详细验证报告。

报告格式:

# JSON 报告
npx claude-flow@alpha verify report --format json

# 带图表的 HTML 报告
npx claude-flow@alpha verify report --export metrics.html --format html

# 用于数据分析的 CSV
npx claude-flow@alpha verify report --format csv --export metrics.csv

# Markdown 摘要
npx claude-flow@alpha verify report --format markdown

基于时间的报告:

# 最后 24 小时
npx claude-flow@alpha verify report --period 24h

# 最后 7 天
npx claude-flow@alpha verify report --period 7d

# 最后 30 天带趋势
npx claude-flow@alpha verify report --period 30d --include-trends

# 自定义日期范围
npx claude-flow@alpha verify report --from 2025-01-01 --to 2025-01-31

报告内容:

  • 总体真相分数
  • 每个代理的性能指标
  • 任务完成质量
  • 验证通过/失败率
  • 回滚频率
  • 质量改进趋势
  • 统计置信区间

交互式仪表板

启动仪表板

运行带实时更新的基于 Web 的交互式验证仪表板。

# 在默认端口(3000)启动仪表板
npx claude-flow@alpha verify dashboard

# 自定义端口
npx claude-flow@alpha verify dashboard --port 8080

# 导出仪表板数据
npx claude-flow@alpha verify dashboard --export

# 带自动刷新的仪表板
npx claude-flow@alpha verify dashboard --refresh 5s

仪表板功能:

  • 实时真相分数更新(WebSocket)
  • 交互式图表和图形
  • 代理性能比较
  • 任务历史时间线
  • 回滚历史查看器
  • 导出到 PDF/HTML
  • 按时间周期/代理/分数过滤

配置

默认配置

.claude-flow/config.json 中设置验证首选项:

{
  "verification": {
    "threshold": 0.95,
    "autoRollback": true,
    "gitIntegration": true,
    "hooks": {
      "preCommit": true,
      "preTask": true,
      "postEdit": true
    },
    "checks": {
      "codeCorrectness": true,
      "security": true,
      "performance": true,
      "documentation": true,
      "bestPractices": true
    }
  },
  "truth": {
    "defaultFormat": "table",
    "defaultPeriod": "24h",
    "warningThreshold": 0.85,
    "criticalThreshold": 0.75,
    "autoExport": {
      "enabled": true,
      "path": ".claude-flow/metrics/truth-daily.json"
    }
  }
}

阈值配置

调整验证严格度:

# 严格模式(需要 99% 准确度)
npx claude-flow@alpha verify check --threshold 0.99

# 宽松模式(90% 可接受)
npx claude-flow@alpha verify check --threshold 0.90

# 设置默认阈值
npx claude-flow@alpha config set verification.threshold 0.98

每个环境的阈值:

{
  "verification": {
    "thresholds": {
      "production": 0.99,
      "staging": 0.95,
      "development": 0.90
    }
  }
}

集成示例

CI/CD 集成

GitHub Actions:

name: 质量验证

on: [push, pull_request]

jobs:
  verify:
    runs-on: ubuntu-latest
    steps:
      - uses: actions/checkout@v3

      - name: 安装依赖
        run: npm install

      - name: 运行验证
        run: |
          npx claude-flow@alpha verify check --json > verification.json

      - name: 检查真相分数
        run: |
          score=$(jq '.overallScore' verification.json)
          if (( $(echo "$score < 0.95" | bc -l) )); then
            echo "真相分数过低:$score"
            exit 1
          fi

      - name: 上传报告
        uses: actions/upload-artifact@v3
        with:
          name: verification-report
          path: verification.json

GitLab CI:

verify:
  stage: test
  script:
    - npx claude-flow@alpha verify check --threshold 0.95 --json > verification.json
    - |
      score=$(jq '.overallScore' verification.json)
      if [ $(echo "$score < 0.95" | bc) -eq 1 ]; then
        echo "验证失败,分数:$score"
        exit 1
      fi
  artifacts:
    paths:
      - verification.json
    reports:
      junit: verification.json

Swarm 集成

在群集操作期间自动运行验证:

# 带验证启用的群集
npx claude-flow@alpha swarm --verify --threshold 0.98

# 带自动回滚的蜂巢思维
npx claude-flow@alpha hive-mind --verify --rollback-on-fail

# 带验证的训练流水线
npx claude-flow@alpha train --verify --threshold 0.99

结对编程集成

在协作开发期间启用实时验证:

# 带验证结对
npx claude-flow@alpha pair --verify --real-time

# 带自定义阈值结对
npx claude-flow@alpha pair --verify --threshold 0.97 --auto-fix

高级工作流

持续验证

在开发期间持续监控代码库:

# 观察目录更改
npx claude-flow@alpha verify watch --directory src/

# 带自动修复观察
npx claude-flow@alpha verify watch --directory src/ --auto-fix

# 带通知观察
npx claude-flow@alpha verify watch --notify --threshold 0.95

监控集成

发送指标到外部监控系统:

# 导出到 Prometheus
npx claude-flow@alpha truth --format json | \
  curl -X POST https://pushgateway.example.com/metrics/job/claude-flow \
  -d @-

# 发送到 DataDog
npx claude-flow@alpha verify report --format json | \
  curl -X POST "https://api.datadoghq.com/api/v1/series?api_key=${DD_API_KEY}" \
  -H "Content-Type: application/json" \
  -d @-

# 自定义 Webhook
npx claude-flow@alpha truth --format json | \
  curl -X POST https://metrics.example.com/api/truth \
  -H "Content-Type: application/json" \
  -d @-

预提交钩子

在提交前自动验证:

# 安装预提交钩子
npx claude-flow@alpha verify install-hook --pre-commit

# .git/hooks/pre-commit 示例:
#!/bin/bash
npx claude-flow@alpha verify check --threshold 0.95 --json > /tmp/verify.json

score=$(jq '.overallScore' /tmp/verify.json)
if (( $(echo "$score < 0.95" | bc -l) )); then
  echo "❌ 验证失败,分数:$score"
  echo "运行 'npx claude-flow@alpha verify check --verbose' 获取详情"
  exit 1
fi

echo "✅ 验证通过,分数:$score"

性能指标

验证速度:

  • 单个文件检查:<100 毫秒
  • 目录扫描:<500 毫秒(每 100 个文件)
  • 完整代码库分析:<5 秒(典型项目)
  • 真相分数计算:<50 毫秒

回滚速度:

  • 基于 Git 的回滚:<1 秒
  • 选择性文件回滚:<500 毫秒
  • 备份创建:<2 秒

仪表板性能:

  • 初始加载:<1 秒
  • 实时更新:<100 毫秒延迟(WebSocket)
  • 图表渲染:60 FPS

故障排除

常见问题

低真相分数:

# 获取详细分解
npx claude-flow@alpha truth --verbose --threshold 0.0

# 检查特定标准
npx claude-flow@alpha verify check --verbose

# 查看代理特定问题
npx claude-flow@alpha truth --agent <agent-name> --format json

回滚失败:

# 检查 git 状态
git status

# 查看回滚历史
npx claude-flow@alpha verify rollback --history

# 手动回滚
git reset --hard HEAD~1

验证超时:

# 增加超时
npx claude-flow@alpha verify check --timeout 60s

# 批量验证
npx claude-flow@alpha verify batch --batch-size 10

退出代码

验证命令返回标准退出代码:

  • 0:验证通过(分数 ≥ 阈值)
  • 1:验证失败(分数 < 阈值)
  • 2:验证期间错误(无效输入、系统错误)

相关命令

  • npx claude-flow@alpha pair - 带验证的协作开发
  • npx claude-flow@alpha train - 带验证反馈的训练
  • npx claude-flow@alpha swarm - 带质量检查的多代理协调
  • npx claude-flow@alpha report - 生成全面的项目报告

最佳实践

  1. 设置适当的阈值:关键代码使用 0.99,标准代码使用 0.95,实验性代码使用 0.90
  2. 启用自动回滚:防止不良代码持续存在
  3. 监控趋势:跟踪随时间改进,不仅仅是当前分数
  4. 集成到 CI/CD:将验证作为流水线的一部分
  5. 使用观察模式:在开发期间获得即时反馈
  6. 导出指标:在监控系统中跟踪质量指标
  7. 审查回滚:理解更改被拒绝的原因
  8. 训练代理:使用验证反馈改进代理性能

附加资源

  • 真相评分算法:见 /docs/truth-scoring.md
  • 验证标准:见 /docs/verification-criteria.md
  • 集成示例:见 /examples/verification/
  • API 参考:见 /docs/api/verification.md