name: “验证与质量保证” description: “全面的真相评分、代码质量验证和自动回滚系统,准确度阈值为0.95,用于确保高质量代理输出和代码库可靠性。” version: “2.0.0” category: “quality-assurance” tags: [“verification”, “truth-scoring”, “quality”, “rollback”, “metrics”, “ci-cd”]
验证与质量保证技能
这个技能的作用
这个技能提供了一个全面的验证和质量保证系统,通过以下方式确保代码质量和正确性:
- 真相评分:代码、代理和任务的实时可靠性指标(0.0-1.0 比例)
- 验证检查:自动代码正确性、安全性和最佳实践验证
- 自动回滚:立即回滚未通过验证的更改(默认阈值:0.95)
- 质量指标:带趋势、置信区间和改进跟踪的统计分析
- CI/CD 集成:持续集成流水线的导出功能
- 实时监控:用于持续验证的实时仪表板和观察模式
先决条件
- 已安装 Claude Flow(
npx claude-flow@alpha) - Git 仓库(用于回滚功能)
- Node.js 18+(用于仪表板功能)
快速开始
# 查看当前真相分数
npx claude-flow@alpha truth
# 运行验证检查
npx claude-flow@alpha verify check
# 使用自定义阈值验证特定文件
npx claude-flow@alpha verify check --file src/app.js --threshold 0.98
# 回滚上次失败的验证
npx claude-flow@alpha verify rollback --last-good
完整指南
真相评分系统
查看真相指标
显示代码库和代理任务的全面质量和可靠性指标。
基本用法:
# 查看当前真相分数(默认:表格格式)
npx claude-flow@alpha truth
# 查看特定时间段的分数
npx claude-flow@alpha truth --period 7d
# 查看特定代理的分数
npx claude-flow@alpha truth --agent coder --period 24h
# 查找低于阈值的文件/任务
npx claude-flow@alpha truth --threshold 0.8
输出格式:
# 表格格式(默认)
npx claude-flow@alpha truth --format table
# JSON 用于编程访问
npx claude-flow@alpha truth --format json
# CSV 用于电子表格分析
npx claude-flow@alpha truth --format csv
# 带可视化的 HTML 报告
npx claude-flow@alpha truth --format html --export report.html
实时监控:
# 观察模式带实时更新
npx claude-flow@alpha truth --watch
# 自动导出指标
npx claude-flow@alpha truth --export .claude-flow/metrics/truth-$(date +%Y%m%d).json
真相分数仪表板
示例仪表板输出:
📊 真相指标仪表板
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
总体真相分数:0.947 ✅
趋势:↗️ +2.3% (7d)
表现最佳者:
verification-agent 0.982 ⭐
code-analyzer 0.971 ⭐
test-generator 0.958 ✅
需关注者:
refactor-agent 0.821 ⚠️
docs-generator 0.794 ⚠️
最近任务:
task-456 0.991 ✅ "实施认证"
task-455 0.967 ✅ "添加测试"
task-454 0.743 ❌ "重构 API"
指标解释
真相分数(0.0-1.0):
1.0-0.95:优秀 ⭐(生产就绪)0.94-0.85:良好 ✅(可接受质量)0.84-0.75:警告 ⚠️(需要关注)<0.75:严重 ❌(需要立即行动)
趋势指示器:
- ↗️ 改善(积极趋势)
- → 稳定(一致表现)
- ↘️ 下降(检测到质量回归)
统计:
- 平均分数:所有测量的平均真相分数
- 中位数分数:中间值(较少受异常值影响)
- 标准差:分数的一致性(越低越一致)
- 置信区间:测量的统计可靠性
验证检查
运行验证
对代码、任务或代理输出执行全面的验证检查。
文件验证:
# 验证单个文件
npx claude-flow@alpha verify check --file src/app.js
# 递归验证目录
npx claude-flow@alpha verify check --directory src/
# 启用自动修复验证
npx claude-flow@alpha verify check --file src/utils.js --auto-fix
# 验证当前工作目录
npx claude-flow@alpha verify check
任务验证:
# 验证特定任务输出
npx claude-flow@alpha verify check --task task-123
# 使用自定义阈值验证
npx claude-flow@alpha verify check --task task-456 --threshold 0.99
# 详细输出用于调试
npx claude-flow@alpha verify check --task task-789 --verbose
批量验证:
# 并行验证多个文件
npx claude-flow@alpha verify batch --files "*.js" --parallel
# 使用模式匹配验证
npx claude-flow@alpha verify batch --pattern "src/**/*.ts"
# 集成测试套件
npx claude-flow@alpha verify integration --test-suite full
验证标准
验证系统评估:
-
代码正确性
- 语法验证
- 类型检查(TypeScript)
- 逻辑流分析
- 错误处理完整性
-
最佳实践
- 代码风格遵守
- SOLID 原则
- 设计模式使用
- 模块化和可重用性
-
安全性
- 漏洞扫描
- 秘密检测
- 输入验证
- 认证/授权检查
-
性能
- 算法复杂度
- 内存使用模式
- 数据库查询优化
- 包大小影响
-
文档
- JSDoc/TypeDoc 完整性
- README 准确性
- API 文档
- 代码注释质量
用于 CI/CD 的 JSON 输出
# 获取结构化 JSON 输出
npx claude-flow@alpha verify check --json > verification.json
# 示例 JSON 结构:
{
"overallScore": 0.947,
"passed": true,
"threshold": 0.95,
"checks": [
{
"name": "code-correctness",
"score": 0.98,
"passed": true
},
{
"name": "security",
"score": 0.91,
"passed": false,
"issues": [...]
}
]
}
自动回滚
回滚失败的更改
自动回滚未通过验证检查的更改。
基本回滚:
# 回滚到最后已知良好状态
npx claude-flow@alpha verify rollback --last-good
# 回滚到特定提交
npx claude-flow@alpha verify rollback --to-commit abc123
# 带预览的交互式回滚
npx claude-flow@alpha verify rollback --interactive
智能回滚:
# 仅回滚失败的文件(保留良好更改)
npx claude-flow@alpha verify rollback --selective
# 带自动备份回滚
npx claude-flow@alpha verify rollback --backup-first
# 干运行模式(预览而不执行)
npx claude-flow@alpha verify rollback --dry-run
回滚性能:
- 基于 Git 的回滚:<1 秒
- 选择性文件回滚:<500 毫秒
- 备份创建:回滚前自动
验证报告
生成报告
创建带指标和可视化的详细验证报告。
报告格式:
# JSON 报告
npx claude-flow@alpha verify report --format json
# 带图表的 HTML 报告
npx claude-flow@alpha verify report --export metrics.html --format html
# 用于数据分析的 CSV
npx claude-flow@alpha verify report --format csv --export metrics.csv
# Markdown 摘要
npx claude-flow@alpha verify report --format markdown
基于时间的报告:
# 最后 24 小时
npx claude-flow@alpha verify report --period 24h
# 最后 7 天
npx claude-flow@alpha verify report --period 7d
# 最后 30 天带趋势
npx claude-flow@alpha verify report --period 30d --include-trends
# 自定义日期范围
npx claude-flow@alpha verify report --from 2025-01-01 --to 2025-01-31
报告内容:
- 总体真相分数
- 每个代理的性能指标
- 任务完成质量
- 验证通过/失败率
- 回滚频率
- 质量改进趋势
- 统计置信区间
交互式仪表板
启动仪表板
运行带实时更新的基于 Web 的交互式验证仪表板。
# 在默认端口(3000)启动仪表板
npx claude-flow@alpha verify dashboard
# 自定义端口
npx claude-flow@alpha verify dashboard --port 8080
# 导出仪表板数据
npx claude-flow@alpha verify dashboard --export
# 带自动刷新的仪表板
npx claude-flow@alpha verify dashboard --refresh 5s
仪表板功能:
- 实时真相分数更新(WebSocket)
- 交互式图表和图形
- 代理性能比较
- 任务历史时间线
- 回滚历史查看器
- 导出到 PDF/HTML
- 按时间周期/代理/分数过滤
配置
默认配置
在 .claude-flow/config.json 中设置验证首选项:
{
"verification": {
"threshold": 0.95,
"autoRollback": true,
"gitIntegration": true,
"hooks": {
"preCommit": true,
"preTask": true,
"postEdit": true
},
"checks": {
"codeCorrectness": true,
"security": true,
"performance": true,
"documentation": true,
"bestPractices": true
}
},
"truth": {
"defaultFormat": "table",
"defaultPeriod": "24h",
"warningThreshold": 0.85,
"criticalThreshold": 0.75,
"autoExport": {
"enabled": true,
"path": ".claude-flow/metrics/truth-daily.json"
}
}
}
阈值配置
调整验证严格度:
# 严格模式(需要 99% 准确度)
npx claude-flow@alpha verify check --threshold 0.99
# 宽松模式(90% 可接受)
npx claude-flow@alpha verify check --threshold 0.90
# 设置默认阈值
npx claude-flow@alpha config set verification.threshold 0.98
每个环境的阈值:
{
"verification": {
"thresholds": {
"production": 0.99,
"staging": 0.95,
"development": 0.90
}
}
}
集成示例
CI/CD 集成
GitHub Actions:
name: 质量验证
on: [push, pull_request]
jobs:
verify:
runs-on: ubuntu-latest
steps:
- uses: actions/checkout@v3
- name: 安装依赖
run: npm install
- name: 运行验证
run: |
npx claude-flow@alpha verify check --json > verification.json
- name: 检查真相分数
run: |
score=$(jq '.overallScore' verification.json)
if (( $(echo "$score < 0.95" | bc -l) )); then
echo "真相分数过低:$score"
exit 1
fi
- name: 上传报告
uses: actions/upload-artifact@v3
with:
name: verification-report
path: verification.json
GitLab CI:
verify:
stage: test
script:
- npx claude-flow@alpha verify check --threshold 0.95 --json > verification.json
- |
score=$(jq '.overallScore' verification.json)
if [ $(echo "$score < 0.95" | bc) -eq 1 ]; then
echo "验证失败,分数:$score"
exit 1
fi
artifacts:
paths:
- verification.json
reports:
junit: verification.json
Swarm 集成
在群集操作期间自动运行验证:
# 带验证启用的群集
npx claude-flow@alpha swarm --verify --threshold 0.98
# 带自动回滚的蜂巢思维
npx claude-flow@alpha hive-mind --verify --rollback-on-fail
# 带验证的训练流水线
npx claude-flow@alpha train --verify --threshold 0.99
结对编程集成
在协作开发期间启用实时验证:
# 带验证结对
npx claude-flow@alpha pair --verify --real-time
# 带自定义阈值结对
npx claude-flow@alpha pair --verify --threshold 0.97 --auto-fix
高级工作流
持续验证
在开发期间持续监控代码库:
# 观察目录更改
npx claude-flow@alpha verify watch --directory src/
# 带自动修复观察
npx claude-flow@alpha verify watch --directory src/ --auto-fix
# 带通知观察
npx claude-flow@alpha verify watch --notify --threshold 0.95
监控集成
发送指标到外部监控系统:
# 导出到 Prometheus
npx claude-flow@alpha truth --format json | \
curl -X POST https://pushgateway.example.com/metrics/job/claude-flow \
-d @-
# 发送到 DataDog
npx claude-flow@alpha verify report --format json | \
curl -X POST "https://api.datadoghq.com/api/v1/series?api_key=${DD_API_KEY}" \
-H "Content-Type: application/json" \
-d @-
# 自定义 Webhook
npx claude-flow@alpha truth --format json | \
curl -X POST https://metrics.example.com/api/truth \
-H "Content-Type: application/json" \
-d @-
预提交钩子
在提交前自动验证:
# 安装预提交钩子
npx claude-flow@alpha verify install-hook --pre-commit
# .git/hooks/pre-commit 示例:
#!/bin/bash
npx claude-flow@alpha verify check --threshold 0.95 --json > /tmp/verify.json
score=$(jq '.overallScore' /tmp/verify.json)
if (( $(echo "$score < 0.95" | bc -l) )); then
echo "❌ 验证失败,分数:$score"
echo "运行 'npx claude-flow@alpha verify check --verbose' 获取详情"
exit 1
fi
echo "✅ 验证通过,分数:$score"
性能指标
验证速度:
- 单个文件检查:<100 毫秒
- 目录扫描:<500 毫秒(每 100 个文件)
- 完整代码库分析:<5 秒(典型项目)
- 真相分数计算:<50 毫秒
回滚速度:
- 基于 Git 的回滚:<1 秒
- 选择性文件回滚:<500 毫秒
- 备份创建:<2 秒
仪表板性能:
- 初始加载:<1 秒
- 实时更新:<100 毫秒延迟(WebSocket)
- 图表渲染:60 FPS
故障排除
常见问题
低真相分数:
# 获取详细分解
npx claude-flow@alpha truth --verbose --threshold 0.0
# 检查特定标准
npx claude-flow@alpha verify check --verbose
# 查看代理特定问题
npx claude-flow@alpha truth --agent <agent-name> --format json
回滚失败:
# 检查 git 状态
git status
# 查看回滚历史
npx claude-flow@alpha verify rollback --history
# 手动回滚
git reset --hard HEAD~1
验证超时:
# 增加超时
npx claude-flow@alpha verify check --timeout 60s
# 批量验证
npx claude-flow@alpha verify batch --batch-size 10
退出代码
验证命令返回标准退出代码:
0:验证通过(分数 ≥ 阈值)1:验证失败(分数 < 阈值)2:验证期间错误(无效输入、系统错误)
相关命令
npx claude-flow@alpha pair- 带验证的协作开发npx claude-flow@alpha train- 带验证反馈的训练npx claude-flow@alpha swarm- 带质量检查的多代理协调npx claude-flow@alpha report- 生成全面的项目报告
最佳实践
- 设置适当的阈值:关键代码使用 0.99,标准代码使用 0.95,实验性代码使用 0.90
- 启用自动回滚:防止不良代码持续存在
- 监控趋势:跟踪随时间改进,不仅仅是当前分数
- 集成到 CI/CD:将验证作为流水线的一部分
- 使用观察模式:在开发期间获得即时反馈
- 导出指标:在监控系统中跟踪质量指标
- 审查回滚:理解更改被拒绝的原因
- 训练代理:使用验证反馈改进代理性能
附加资源
- 真相评分算法:见
/docs/truth-scoring.md - 验证标准:见
/docs/verification-criteria.md - 集成示例:见
/examples/verification/ - API 参考:见
/docs/api/verification.md