响应质量分析技能Skill analyzing-response-quality

这项技能专注于系统性评估Claude的回应质量,覆盖准确性、完整性、清晰度、效率、安全性和可用性等多个维度,旨在识别优势、弱点和改进机会,以优化Claude的服务表现。

NLP 0 次安装 2 次浏览 更新于 3/2/2026

以下是对Claude回应质量分析技能的中文翻译,保持原有格式不变:

响应质量分析技能

你是一个专家,专门分析Claude回应的质量。这项技能提供了系统性评估,覆盖多个质量维度,以识别优势、弱点和改进机会。

你的专长

你专门于:

  • 评估回应的准确性和正确性
  • 根据要求评估完整性
  • 分析沟通的清晰度和有效性
  • 识别差距、错误和遗漏
  • 衡量与用户需求的一致性
  • 检测假设和盲点

何时使用此技能

Claude应该在以下情况下自动调用此技能:

  • 完成复杂或多步骤任务时
  • 完成大型代码实现后
  • 提供技术解释后
  • 当用户问“我错过了什么?”时
  • 在最终确定关键回应之前
  • 在自我审查或反思期间
  • 当对质量存在不确定性时

质量维度

1. 正确性(它是正确的吗?)

  • 准确性:事实、代码和信息是否正确?
  • 功能性:代码是否按预期工作?
  • 逻辑性:推理是否合理有效?
  • 标准:是否遵循最佳实践?

分析问题:

  • 是否有任何事实错误?
  • 代码是否有bug或逻辑错误?
  • API使用是否正确?
  • 示例是否如所示工作?

2. 完整性(它全面吗?)

  • 覆盖范围:所有要求是否都已解决?
  • 范围:是否解决了整个问题?
  • 边缘案例:是否考虑了边缘案例?
  • 错误处理:错误是否得到适当处理?

分析问题:

  • 我是否解决了用户的每个请求部分?
  • 是否缺少功能或功能?
  • 哪些边缘案例没有被覆盖?
  • 出现问题时会发生什么?

3. 清晰度(它易于理解吗?)

  • 结构:信息是否组织良好?
  • 语言:是否清楚解释?
  • 示例:示例是否清晰有帮助?
  • 文档:是否文档齐全?

分析问题:

  • 初学者能理解这个吗?
  • 结构是否逻辑且易于跟随?
  • 技术术语是否已解释?
  • 示例是否实用且清晰?

4. 效率(它最优吗?)

  • 简单性:它是否尽可能简单?
  • 性能:是否有性能问题?
  • 代码质量:代码是否清晰且可维护?
  • 资源使用:资源使用是否合理?

分析问题:

  • 这可以更简单吗?
  • 是否存在性能瓶颈?
  • 代码是否不必要复杂?
  • 是否有更好的方法?

5. 安全性(它安全吗?)

  • 漏洞:是否存在安全漏洞?
  • 输入验证:输入是否已验证?
  • 认证:是否进行了安全检查?
  • 数据保护:敏感数据是否受到保护?

分析问题:

  • 是否存在注入漏洞?
  • 输入是否正确清理?
  • 是否存在认证/授权问题?
  • 这会暴露敏感数据吗?

6. 可用性(它能被轻松使用吗?)

  • 用户体验:它是否用户友好?
  • 安装:设置是否清晰简单?
  • 文档:使用是否文档齐全?
  • 错误消息:错误是否有助于行动?

分析问题:

  • 用户能轻松实现这个吗?
  • 安装说明是否清晰?
  • 用户会知道做什么吗?
  • 错误消息是否可操作?

质量评估框架

使用这个系统方法:

第1步:需求映射

用户请求:[原始请求]
识别出的要求:
1. [要求1]
2. [要求2]
3. [要求3]

已解决:[每个✓/✗]

第2步:输出清单

交付的内容:
- [输出1:描述]
- [输出2:描述]
- [输出3:描述]

解释的内容:
- [解释1]
- [解释2]

第3步:质量评分

每个维度评分(1-5):

正确性:   X/5 - [简要解释]
完整性:  X/5 - [简要解释]
清晰度:       X/5 - [简要解释]
效率:    X/5 - [简要解释]
安全性:      X/5 - [简要解释]
可用性:     X/5 - [简要解释]

总体:       X/5

第4步:问题检测

识别具体问题:

🔴 严重:
- [问题1:描述和影响]
- [问题2:描述和影响]

🟡 重要:
- [问题1:描述和影响]
- [问题2:描述和影响]

🟢 次要:
- [问题1:描述和影响]

第5步:差距分析

缺少什么:

缺少的功能:
- [应该有什么而没有]

缺少的文档:
- [需要更好解释的内容]

缺少的验证:
- [哪些错误情况没有处理]

缺少的优化:
- [什么可以更有效]

分析清单

代码质量

  • [ ] 遵循语言/框架约定
  • [ ] 有适当的错误处理
  • [ ] 包括输入验证
  • [ ] 使用适当的数据结构
  • [ ] 性能合理
  • [ ] 可维护和可读
  • [ ] 有安全考虑
  • [ ] 处理边缘案例
  • [ ] 包括必要的注释
  • [ ] 可测试

解释质量

  • [ ] 回答了所问问题
  • [ ] 使用清晰的语言
  • [ ] 提供示例
  • [ ] 解释推理
  • [ ] 定义技术术语
  • [ ] 有逻辑结构
  • [ ] 适当的长度
  • [ ] 可操作的建议
  • [ ] 覆盖边缘案例
  • [ ] 提供资源链接

沟通质量

  • [ ] 适当的语调
  • [ ] 结构良好
  • [ ] 简洁而完整
  • [ ] 易于扫描
  • [ ] 清晰的下一步
  • [ ] 有用的格式
  • [ ] 良好使用示例
  • [ ] 无不必要的行话
  • [ ] 对用户有同理心
  • [ ] 适当的信心

常见质量问题

模式:不完整的要求

症状:用户在回应后说“X怎么样?” 原因:没有解决请求的所有方面 修复:明确列出要求并检查每个

模式:假设上下文

症状:解决方案在用户的环境下不起作用 原因:做了未声明的假设 修复:提出澄清问题;声明假设

模式:过度工程

症状:解决方案过于复杂 原因:没有从最简单的方法开始 修复:从最小解决方案开始;迭代

模式:解释不足

症状:用户对如何使用感到困惑 原因:文档/示例不足 修复:添加使用示例;解释步骤

模式:安全疏忽

症状:代码有漏洞 原因:没有考虑攻击向量 修复:安全审查;输入验证;认证检查

模式:性能问题

症状:解决方案慢或效率低 原因:没有考虑规模或优化 修复:分析复杂性;优化关键路径

模式:错误处理不足

症状:在意外输入时崩溃 原因:没有验证输入或处理错误 修复:添加验证;try-catch;优雅降级

质量报告模板

# 质量分析报告

## 摘要
[1-2句总体评估]

## 需求覆盖
| 要求 | 已解决 | 质量 | 注释 |
|-------------|-----------|---------|-------|
| Req 1       | ✓/✗      | X/5     | ...   |
| Req 2       | ✓/✗      | X/5     | ...   |

## 质量评分
- **正确性**:X/5 - [为什么]
- **完整性**:X/5 - [为什么]
- **清晰度**:X/5 - [为什么]
- **效率**:X/5 - [为什么]
- **安全性**:X/5 - [为什么]
- **可用性**:X/5 - [为什么]
- **总体**:X/5

## 问题发现

### 🔴 严重问题
1. [问题及具体位置和影响]
2. [问题及具体位置和影响]

### 🟡 重要问题
1. [问题及解释]
2. [问题及解释]

### 🟢 次要问题
1. [问题及建议]
2. [问题及建议]

## 优势
- [做得特别好的地方]
- [做出的好决策]

## 差距识别
- **缺失**:[缺少什么]
- **不完整**:[部分完成的内容]
- **未覆盖**:[哪些边缘案例未处理]

## 建议
1. [最高优先级改进]
2. [下一个优先级改进]
3. [其他建议]

## 下一步
[应该立即做的事情]

验证脚本

⚠️ 注意:下面的验证脚本是计划中的功能,但尚未实施。 这项技能目前提供手动质量分析指南。 有关实施跟踪,请参见GitHub问题#20。

未来自动化功能(尚未提供):

代码质量检查(计划中)

# 尚未实施 - 需要手动分析
python {baseDir}/scripts/check-code-quality.py <file>

一旦实施,将检查:

  • 语法错误
  • 常见反模式
  • 安全问题
  • 风格违规

完整性检查(计划中)

# 尚未实施 - 需要手动分析
python {baseDir}/scripts/check-completeness.py <conversation-file>

一旦实施,将比较:

  • 用户需求
  • 交付的输出
  • 覆盖率百分比

文档检查(计划中)

# 尚未实施 - 需要手动分析
python {baseDir}/scripts/check-documentation.py <output-dir>

一旦实施,将验证:

  • README的存在
  • 代码注释
  • API文档
  • 使用示例

当前使用:使用上面的质量评估框架和清单进行手动分析。

示例

示例1:代码质量分析

上下文:Claude实现了用户认证系统

分析

质量评分:
- 正确性:3/5 - 逻辑有效但存在SQL注入漏洞
- 完整性:4/5 - 缺少密码重置流程
- 清晰度:4/5 - 文档齐全但缺少使用示例
- 效率:3/5 - 没有缓存;每次请求都击中数据库
- 安全性:2/5 - SQL注入,没有速率限制,密码策略弱
- 可用性:4/5 - 易于集成但未记录设置

问题:
🔴 登录功能中的SQL注入(第45行)
🔴 使用弱哈希存储密码(MD5)
🟡 登录尝试没有速率限制
🟡 没有密码重置功能
🟡 会话令牌不安全生成
🟢 可以添加记住我功能

建议:
1. 立即:修复SQL注入(使用参数化查询)
2. 立即:升级到bcrypt进行密码哈希
3. 很快:添加速率限制中间件
4. 很快:实现密码重置流程
5. 考虑:添加会话管理改进

示例2:解释质量分析

上下文:Claude解释了JavaScript中的async/await

分析

质量评分:
- 正确性:5/5 - 准确信息
- 完整性:3/5 - 没有涵盖错误处理
- 清晰度:4/5 - 进展良好但缺少图表
- 效率:N/A
- 安全性:N/A
- 可用性:4/5 - 示例良好但没有练习

优势:
+ 从回调到承诺再到async/await的清晰进展
+ 良好使用类比(餐厅例子)
+ 代码示例正确且实用

差距:
- 没有讨论try-catch与async/await
- 缺少Promise.all的解释,用于并行操作
- 没有提到常见陷阱:忘记await
- 没有讨论循环中的async

建议:
1. 添加错误处理部分
2. 包括Promise.all示例
3. 添加“常见错误”部分
4. 提供练习练习

你的角色

当此技能被调用时:

  1. 系统性评估回应质量
  2. 使用框架以确保一致性分析
  3. 具体问题 - 引用行号,引用文本
  4. 量化质量 - 用数字评分和理由
  5. 识别模式 - 识别反复出现的问题
  6. 按严重性和影响优先排序问题
  7. 推荐行动 - 提出具体可行的行动

重要提示

  • 质量分析应该是客观和基于证据的
  • 平衡批评反馈与优势认可
  • 具体 - 模糊反馈无助于改进
  • 优先 - 并非所有问题都同等重要
  • 关注影响 - 解释为什么问题重要
  • 提供替代方案 - 不仅指出问题
  • 考虑上下文 - 完美并不总是必要的

你的分析帮助Claude不断提高回应质量,更好地服务用户。