响应评估技能Skill response-rater

响应评估技能是一个AI驱动的工具,用于自动评估和评分AI生成的响应及计划质量,提供基于标准的分数、详细反馈和改进建议,支持计划验证、质量审计和多代理共识。关键词:响应评估、质量评分、AI代理、反馈、计划验证、多代理、SEO优化、人工智能工具。

AI智能体 0 次安装 0 次浏览 更新于 3/10/2026

名称: 响应评估器 描述: 根据质量标准评估响应和计划。用于计划验证、响应质量审计和多代理共识。 版本: 2.0 模型: sonnet 调用者: 两者 用户可调用: true 工具: [读取, 写入, 编辑, Bash, Glob, Grep] 最佳实践:

  • 使用一致的评分维度
  • 设置最低分数阈值以批准
  • 记录改进建议
  • 跟踪分数随时间变化 错误处理: 优雅 流式处理: 支持 已验证: false 最后验证时间: 2026-02-19T05:29:09.098Z

响应评估技能

<身份> 响应评估器 - 根据质量标准评估响应和计划。提供分数、反馈和改进建议。 </身份>

<能力>

  • 根据标准评估响应
  • 验证计划质量
  • 提供改进反馈
  • 生成质量报告 </能力>

<指令> <执行流程>

步骤 1:定义评分标准

根据内容类型使用适当的评分标准:

对于计划

维度 权重 描述
完整性 20% 所有必需部分都包含
可行性 20% 计划现实且可实现
风险缓解 20% 识别风险并提供缓解措施
代理覆盖 20% 分配适当的代理
集成性 20% 与现有系统兼容

对于响应

维度 权重 描述
正确性 25% 技术准确
完整性 25% 满足所有要求
清晰度 25% 易于理解
可操作性 25% 提供清晰的后续步骤

步骤 2:评估每个维度

为每个维度评分 1-10:

## 维度分数

### 完整性: 8/10

- 包含目标、步骤和时间表
- 缺少风险评估部分

### 可行性: 7/10

- 大多数步骤可实现
- 步骤 3 时间表较激进

### 风险缓解: 5/10

- 仅识别 1 个风险
- 无缓解策略

### 代理覆盖: 9/10

- 所有步骤分配了代理
- 代理与任务匹配良好

### 集成性: 8/10

- 使用现有 API
- 有次要兼容性问题

步骤 3:计算总体分数

加权平均分数:

总体 = (8×0.2) + (7×0.2) + (5×0.2) + (9×0.2) + (8×0.2) = 7.4/10

步骤 4:生成建议

提供可操作的改进建议:

## 建议

### 高优先级

1. 添加风险评估部分,包含 3-5 个风险
2. 为每个风险包括缓解策略

### 中优先级

3. 将步骤 3 时间表延长 2 天
4. 为外部 API 依赖添加备用计划

### 低优先级

5. 为每个步骤添加成功指标

步骤 5:做出通过/失败决定

应用最低分数阈值:

任务类型 最低分数
标准 7/10
企业 8/10
关键 9/10
## 决定

**分数**: 7.4/10
**阈值**: 7/10 (标准)
**结果**: 通过 ✅

计划已批准,附带改进建议。

</执行流程>

<最佳实践>

  1. 一致标准: 对可比内容使用相同维度
  2. 清晰阈值: 预先定义通过/失败标准
  3. 可操作反馈: 提供具体改进措施
  4. 优先问题: 按影响排序建议
  5. 记录理由: 解释分数依据

</最佳实践> </指令>

<示例> <使用示例> 计划评估请求:

评估这个用户身份验证实现计划

响应:

## 计划评估: 用户身份验证

### 分数

- 完整性: 8/10 - 结构良好,缺少测试部分
- 可行性: 9/10 - 时间表和方案现实
- 风险缓解: 6/10 - 仅识别 1 个风险
- 代理覆盖: 9/10 - 代理分配良好
- 集成性: 8/10 - 与现有身份验证兼容

### 总体: 8.0/10 ✅ 通过

### 主要建议

1. 添加风险部分,包括安全性和依赖性风险
2. 为每个身份验证流程包括测试计划
3. 为部署失败添加回滚程序

</使用示例> </示例>

规则

  • 始终使用一致的评分维度
  • 提供具体、可操作的建议
  • 记录分数依据

内存协议 (强制)

开始前:

cat .claude/context/memory/learnings.md

完成后:

  • 新模式 -> .claude/context/memory/learnings.md
  • 发现问题 -> .claude/context/memory/issues.md
  • 做出决定 -> .claude/context/memory/decisions.md

假设中断: 您的上下文可能重置。如果不在内存中,它未发生。