名称: 食谱审计描述: 基于评分标准对Anthropic食谱笔记本进行审计。每当需要笔记本审查或审计时使用。

食谱审计

说明

使用style_guide.md中的指南和评分标准审查请求的食谱笔记本。根据评分指南提供分数，并提出改进食谱的建议。

风格指南提供了详细的模板和示例，涵盖：

以问题为中心的引言，包含终端学习目标（TLOs）和促成学习目标（ELOs）
先决条件和设置模式
核心内容结构
映射回学习目标的结论

重要提示：在进行审计之前，务必先阅读style_guide.md。风格指南包含规范的模板和可供参考的好/坏示例。

工作流程

按照以下步骤进行全面审计：

阅读风格指南：首先查看style_guide.md以了解当前最佳实践
识别笔记本：如果未提供路径，请向用户询问
运行自动检查：使用python3 validate_notebook.py <路径>捕获技术问题并生成Markdown
- 脚本自动运行detect-secrets以扫描硬编码的API密钥和凭据
- 使用scripts/detect-secrets/plugins.py中定义的自定义模式
- 根据scripts/detect-secrets/.secrets.baseline的基线进行检查
查看Markdown输出：脚本在tmp/文件夹中生成Markdown文件以便于审查（与原始.ipynb相比节省上下文）
- tmp/文件夹被git忽略以避免提交审查工件
- Markdown包含代码单元格但排除输出以获得更清晰的审查
手动审查：通读Markdown版本，根据风格指南和评分标准进行评估
为每个维度评分：客观应用评分指南
生成报告：按照以下审计报告格式
提供具体示例：使用风格指南模板中的行引用展示具体改进

审计报告格式

使用此结构呈现您的审计：

执行摘要

总体得分：X/20
关键优势（2-3个要点）
关键问题（2-3个要点）

详细评分

1. 叙述质量：X/5

[简要说明并附具体示例]

2. 代码质量：X/5

[简要说明并附具体示例]

3. 技术准确性：X/5

[简要说明并附具体示例]

4. 可操作性与理解性：X/5

[简要说明并附具体示例]

具体建议

[按优先级排序、可操作的改进列表，附具体章节引用]

示例与建议

[展示笔记本中的具体摘录，并提供具体的改进建议]

快速参考清单

使用此清单确保全面覆盖：

引言（参见style_guide.md第1节）

[ ] 以解决的问题为切入点（1-2句话）
[ ] 解释其重要性（1-2句话）
[ ] 以要点形式列出学习目标（2-4个TLOs/ELOs）
[ ] 关注交付的价值，而非构建的机制
[ ] 可选：提及更广泛的应用（1句话）

先决条件与设置（参见style_guide.md第2节）

[ ] 清晰列出所需知识
[ ] 列出所需工具（Python版本、API密钥）
[ ] 如适用，提及推荐背景
[ ] 使用%%capture进行pip安装以抑制输出
[ ] 使用dotenv.load_dotenv()而非os.environ
[ ] 在顶部定义MODEL常量
[ ] 将相关安装分组在单个命令中

结构与组织

[ ] 具有逻辑性的章节进展
[ ] 每个章节通过演示进行教学
[ ] 代码块前有解释性文本
[ ] 代码块后包含所学内容
[ ] 使用标题分隔章节

结论（参见style_guide.md第4节）

[ ] 映射回学习目标
[ ] 总结完成的内容
[ ] 建议如何将经验教训应用于用户场景
[ ] 指向后续步骤或相关资源

代码质量

[ ] 所有代码块前都有解释性文本
[ ] 无硬编码API密钥（由detect-secrets自动检查）
[ ] 有意义的变量名
[ ] 注释解释“为什么”而非“是什么”
[ ] 遵循语言最佳实践
[ ] 模型名称在笔记本顶部定义为常量

输出管理

[ ] 使用%%capture抑制pip安装日志
[ ] 无冗长的调试输出
[ ] 显示相关的API响应
[ ] 仅在演示错误处理时显示堆栈跟踪

内容质量

[ ] 解释方法为何有效
[ ] 讨论何时使用此方法
[ ] 提及限制/注意事项
[ ] 提供可迁移的知识
[ ] 适当的模型选择

技术要求

[ ] 无需修改即可执行（API密钥除外）
[ ] 使用非弃用的API模式
[ ] 使用有效的模型名称（claude-sonnet-4-5、claude-haiku-4-5、claude-opus-4-5）
[ ] 模型名称在笔记本顶部定义为常量
[ ] 包含依赖项规范
[ ] 分配到主要类别
[ ] 具有相关标签

内容哲学：行动+理解

食谱主要是面向行动的，但战略性地融入了理解，并受到Diataxis框架的启发。

核心原则：

实用导向：向用户展示如何使用工作代码完成特定任务
问题优先框架：以解决的问题和交付的价值为先导，而非机制
构建者视角：从用户角度出发，解决实际问题
能力建设：帮助用户理解方法为何有效，而不仅仅是方法
可迁移知识：教授适用于特定示例之外的模式和原则
批判性思维：鼓励用户质疑输出、认识局限、做出明智选择
学习契约：预先说明学习目标，然后在结论中映射回这些目标

优秀食谱的特点

优秀的食谱不仅帮助用户解决今天的问题，还帮助他们理解解决方案背后的基本原则，鼓励他们识别何时以及如何调整方法。用户将能够就AI系统设计做出更明智的决策，培养对模型输出的判断力，并建立可迁移到未来AI系统的技能。

食谱不是

食谱不是纯教程：我们假设用户具备基本技术技能和API熟悉度。我们在食谱中明确说明先决条件，并引导用户前往Academy了解更多主题。它们不是全面的解释：我们不教授Transformer架构或概率论。我们需要理解，用户遵循我们的食谱是为了解决他们今天面临的问题。他们很忙，正在学习或构建中，希望能够使用所学知识解决他们的即时需求。食谱不是参考文档：我们不详尽记录每个参数，我们根据需要链接到文档中的适当资源。食谱不是简单的技巧和窍门：我们不教授仅适用于当前模型代的“技巧”。我们不夸大其词，也不交付不足。食谱不是生产就绪的代码：它们展示用例和能力，而非生产模式。不需要过多的错误处理。

风格指南

语气与语调

教育性和能力建设性
专业但平易近人
尊重用户的智力和时间
第二人称（“你”）或第一人称复数（“我们”）——在笔记本内保持一致

写作质量

清晰、简洁的解释
首选主动语态
短段落（3-5句话）
避免未定义的术语
使用标题分隔章节

代码呈现

始终先解释后展示：每个代码块前应有解释性文本
运行后解释：代码块执行后包含所学内容
注释解释原因，而非内容：使用有意义的变量名
使用常量：在顶部将MODEL定义为常量
良好习惯：使用dotenv.load_dotenv()而非os.environ

输出处理

使用%%capture移除无关输出：

pip安装日志（始终抑制这些）
冗长的调试语句
冗长的堆栈跟踪（除非演示错误处理）

显示相关输出：

展示功能的API响应
成功执行的示例

结构要求

参见style_guide.md获取详细模板和示例

1. 引言（必需）

必须包括：

问题切入点（1-2句话）：我们正在解决什么问题？
其重要性（1-2句话）：为什么这很重要？
学习目标（2-4个要点）：“在本食谱结束时，您将能够…”
- 使用动作动词（构建、实现、部署等）
- 具体说明能力
- 包含上下文/约束
可选：更广泛的应用（1句话）

❌ 避免：以机制为先导（“我们将使用Claude SDK构建一个研究代理…”） ✅ 应做：以问题/价值为先导（“您的团队花费数小时处理CI故障…”）

2. 先决条件与设置（必需）

必须包括：

所需知识：所需技术技能
所需工具：Python版本、API密钥及链接
推荐：有帮助的可选背景
设置：分步说明
- 使用%%capture进行pip安装
- 使用dotenv.load_dotenv()而非os.environ
- 在顶部定义MODEL常量

3. 主要内容（必需）

按逻辑步骤或阶段组织，每个部分包括：

清晰的章节标题
代码块前的解释性文本（我们将要做什么）
代码示例
代码块后的解释性文本（我们学到了什么）
预期输出（如相关）
可选：理解性说明（为何有效、何时使用、限制）

4. 结论（推荐）

必须包括：

回顾：映射回学习目标
完成的内容：关键点总结
应用指导：如何将经验教训应用于用户场景
后续步骤：相关资源或可探索的想法

❌ 避免：通用总结（“我们已经演示了SDK如何实现…”） ✅ 应做：可操作的指导（“考虑将此应用于X…接下来，尝试Y…”）

可选章节

工作原理：底层机制的简要解释
何时使用此方法：适当的用例和场景
限制与注意事项：注意事项、失败模式、约束
故障排除：常见问题及解决方案
变体：替代方法或扩展
性能说明：优化注意事项
进一步阅读：相关文档、论文或更深入解释的链接

常见反模式标记

参考style_guide.md获取详细的好/坏示例。注意以下问题：

引言反模式

❌ 以机制为先导：“我们将使用Claude SDK构建一个研究代理…” ❌ 功能堆砌：列出SDK方法或工具能力 ❌ 模糊的学习目标：“了解代理”或“理解API” ✅ 以问题为先导的框架，具有具体、可操作的学习目标

设置反模式

❌ 无%%capture的嘈杂pip安装输出 ❌ 多个独立的pip安装命令 ❌ 使用os.environ["API_KEY"] = "your_key"而非dotenv ❌ 在整个笔记本中硬编码模型名称而非使用MODEL常量 ✅ 干净设置，包含分组安装、dotenv和常量

代码呈现反模式

❌ 代码块前无解释性文本 ❌ 运行代码后无解释 ❌ 解释代码“做什么”的注释（代码应自文档化） ❌ 过度解释明显的代码 ✅ 代码前提供上下文，代码后提供见解，注释解释“为什么”

结论反模式

❌ 通用总结：“我们已经演示了SDK如何实现…” ❌ 仅重述笔记本内容而无指导 ❌ 未映射回所述学习目标 ✅ 关于如何将经验教训应用于用户具体场景的可操作指导

名称: 食谱审计 描述: 基于评分标准对Anthropic食谱笔记本进行审计。每当需要笔记本审查或审计时使用。

食谱审计

说明

工作流程

审计报告格式

执行摘要

详细评分

1. 叙述质量：X/5

2. 代码质量：X/5

3. 技术准确性：X/5

4. 可操作性与理解性：X/5

具体建议

示例与建议

快速参考清单

内容哲学：行动+理解

优秀食谱的特点

食谱不是

风格指南

语气与语调

写作质量

代码呈现

输出处理

结构要求

1. 引言（必需）

2. 先决条件与设置（必需）

3. 主要内容（必需）

4. 结论（推荐）

可选章节

常见反模式标记

引言反模式

设置反模式

代码呈现反模式

结论反模式

名称: 食谱审计描述: 基于评分标准对Anthropic食谱笔记本进行审计。每当需要笔记本审查或审计时使用。