name: 技能创建器 description: “用于创建有效技能的指南,这些技能通过专门的知识、工作流程或工具集成来扩展代理能力。当用户请求时使用此技能:(1) 创建新技能,(2) 制作技能,(3) 构建技能,(4) 设置技能,(5) 初始化技能,(6) 搭建技能,(7) 更新或修改现有技能,(8) 验证技能,(9) 学习技能结构,(10) 理解技能工作原理,或 (11) 获取技能设计模式指导。触发短语如“创建技能”、“新技能”、“制作技能”、“X的技能”、“如何创建技能”或“帮我构建技能”。”
技能创建器
此技能提供创建有效技能的指导。
关于技能
技能是模块化、自包含的包,通过提供专门的知识、工作流程和工具来扩展代理能力。将它们视为特定领域或任务的“入职指南”——它们将通用代理转变为具备程序性知识和领域专业知识的专门代理。
Deepagents 的技能位置
deepagents CLI 从四个目录加载技能,按从低到高的优先级列出:
| # | 目录 | 范围 | 说明 |
|---|---|---|---|
| 1 | ~/.deepagents/<agent>/skills/ |
用户(deepagents 别名) | deepagents skills create 的默认 |
| 2 | ~/.agents/skills/ |
用户 | 跨代理工具共享 |
| 3 | .deepagents/skills/ |
项目(deepagents 别名) | deepagents skills create --project 的默认 |
| 4 | .agents/skills/ |
项目 | 跨代理工具共享 |
<agent> 是代理配置名称(默认:agent)。当两个目录包含同名的技能时,优先级更高的版本获胜——项目技能覆盖用户技能。
示例目录布局:
~/.deepagents/agent/skills/ # 用户技能(最低优先级)
├── 技能名称-1/
│ └── SKILL.md
└── ...
<项目根目录>/.deepagents/skills/ # 项目技能(较高优先级)
├── 技能名称-2/
│ └── SKILL.md
└── ...
技能提供什么
- 专门的工作流程 - 特定领域多步骤程序
- 工具集成 - 用于处理特定文件格式或 API 的指令
- 领域专业知识 - 公司特定知识、模式、业务逻辑
- 捆绑资源 - 用于复杂和重复任务的脚本、参考和资产
核心原则
简洁是关键
上下文窗口是公共资源。技能与代理所需的一切共享上下文窗口:系统提示、对话历史、其他技能的元数据以及实际用户请求。
默认假设:代理已经非常能干。 仅添加代理没有的信息。挑战每条信息:“代理真的需要这个解释吗?”和“这段文字是否值得其标记成本?”
偏好简洁示例而非冗长解释。
设置适当的自由度
将特异性级别与任务的脆弱性和可变性匹配:
高自由度(基于文本的指令):当多种方法有效、决策依赖上下文或启发式指导方法时使用。
中等自由度(伪代码或带参数的脚本):当存在首选模式、某些变化可接受或配置影响行为时使用。
低自由度(特定脚本、少数参数):当操作脆弱且易错、一致性关键或必须遵循特定序列时使用。
将代理视为探索路径:狭窄的桥梁有悬崖需要具体护栏(低自由度),而开阔的田野允许多种路线(高自由度)。
技能的解剖
每个技能由必需的 SKILL.md 文件和可选的捆绑资源组成:
技能名称/
├── SKILL.md (必需)
│ ├── YAML 前端元数据 (必需)
│ │ ├── name: (必需)
│ │ └── description: (必需)
│ └── Markdown 指令 (必需)
└── 捆绑资源 (可选)
├── scripts/ - 可执行代码(Python/Bash等)
├── references/ - 文档,旨在需要时加载到上下文中
└── assets/ - 输出中使用的文件(模板、图标、字体等)
SKILL.md (必需)
每个 SKILL.md 包含:
- 前端元数据 (YAML):包含
name和description字段。这些是代理读取以确定何时使用技能的唯一字段,因此清晰全面地描述技能是什么以及何时使用它非常重要。 - 正文 (Markdown):使用技能的指令和指导。仅在技能触发后加载(如果有的话)。
捆绑资源 (可选)
脚本 (scripts/)
可执行代码(Python/Bash等)用于需要确定性可靠性或重复重写的任务。
- 何时包含:当相同代码重复重写或需要确定性可靠性时
- 示例:
scripts/rotate_pdf.py用于 PDF 旋转任务 - 好处:标记高效、确定性、可能无需加载到上下文即可执行
- 注意:脚本仍可能需要代理读取以进行修补或环境特定调整
参考 (references/)
文档和参考材料,旨在需要时加载到上下文中以通知代理的流程和思考。
- 何时包含:用于代理在操作时应参考的文档
- 示例:
references/finance.md用于财务模式,references/mnda.md用于公司 NDA 模板,references/policies.md用于公司政策,references/api_docs.md用于 API 规范 - 用例:数据库模式、API 文档、领域知识、公司政策、详细工作流程指南
- 好处:保持 SKILL.md 精简,仅在代理确定需要时加载
- 最佳实践:如果文件大(>10k 字),在 SKILL.md 中包含搜索模式
- 避免重复:信息应存在于 SKILL.md 或参考文件中,而不是两者。对于详细信息,优先参考文件,除非真正核心技能——这保持 SKILL.md 精简,同时使信息可发现而不占用上下文窗口。仅在 SKILL.md 中保留基本程序指令和工作流程指导;将详细参考材料、模式和示例移到参考文件。
资产 (assets/)
不打算加载到上下文中的文件,而是在代理产生的输出中使用。
- 何时包含:当技能需要用于最终输出的文件时
- 示例:
assets/logo.png用于品牌资产,assets/slides.pptx用于 PowerPoint 模板,assets/frontend-template/用于 HTML/React 样板,assets/font.ttf用于字体 - 用例:模板、图像、图标、样板代码、字体、复制或修改的示例文档
- 好处:将输出资源与文档分开,使代理能够使用文件而不加载到上下文
技能中不应包含什么
技能应仅包含直接支持其功能的必要文件。不要创建额外的文档或辅助文件,包括:
- README.md
- INSTALLATION_GUIDE.md
- QUICK_REFERENCE.md
- CHANGELOG.md
- 等等。
技能应仅包含 AI 代理完成手头工作所需的信息。不应包含有关创建过程、设置和测试程序、面向用户的文档等的辅助上下文。创建额外的文档文件只会增加杂乱和混淆。
渐进式披露设计原则
技能使用三级加载系统以高效管理上下文:
- 元数据(名称 + 描述) - 始终在上下文中(约100字)
- SKILL.md 正文 - 当技能触发时(<5k 字)
- 捆绑资源 - 根据代理需要(无限,因为脚本可以执行而不读取到上下文窗口)
渐进式披露模式
保持 SKILL.md 正文为 essentials 并少于 500 行以最小化上下文膨胀。超过 10 MB 的 SKILL.md 文件被代理运行时静默跳过。接近行限制时将内容拆分到单独文件。当将内容拆分到其他文件时,从 SKILL.md 引用它们并清楚描述何时读取它们非常重要,以确保技能读者知道它们存在以及何时使用它们。
关键原则:当技能支持多种变体、框架或选项时,仅在 SKILL.md 中保留核心工作流程和选择指导。将变体特定细节(模式、示例、配置)移到单独的参考文件。
模式 1:高级指南带参考
# PDF 处理
## 快速开始
使用 pdfplumber 提取文本:
[代码示例]
## 高级功能
- **表单填充**:参见 [FORMS.md](FORMS.md) 获取完整指南
- **API 参考**:参见 [REFERENCE.md](REFERENCE.md) 获取所有方法
- **示例**:参见 [EXAMPLES.md](EXAMPLES.md) 获取常见模式
代理仅在需要时加载 FORMS.md、REFERENCE.md 或 EXAMPLES.md。
模式 2:领域特定组织
对于具有多个领域的技能,按领域组织内容以避免加载无关上下文:
bigquery-skill/
├── SKILL.md (概述和导航)
└── reference/
├── finance.md (收入、计费指标)
├── sales.md (机会、管道)
├── product.md (API 使用、功能)
└── marketing.md (活动、归因)
当用户询问销售指标时,代理仅读取 sales.md。
类似地,对于支持多个框架或变体的技能,按变体组织:
cloud-deploy/
├── SKILL.md (工作流程 + 提供商选择)
└── references/
├── aws.md (AWS 部署模式)
├── gcp.md (GCP 部署模式)
└── azure.md (Azure 部署模式)
当用户选择 AWS 时,代理仅读取 aws.md。
模式 3:条件细节
显示基本内容,链接到高级内容:
# DOCX 处理
## 创建文档
使用 docx-js 创建新文档。参见 [DOCX-JS.md](DOCX-JS.md)。
## 编辑文档
对于简单编辑,直接修改 XML。
**对于跟踪更改**:参见 [REDLINING.md](REDLINING.md)
**对于 OOXML 细节**:参见 [OOXML.md](OOXML.md)
代理仅在用户需要这些功能时读取 REDLINING.md 或 OOXML.md。
重要指南:
- 避免深层嵌套引用 - 保持引用从 SKILL.md 深一层。所有参考文件应直接从 SKILL.md 链接。
- 构建更长的参考文件 - 对于超过 100 行的文件,在顶部包含目录,以便代理在预览时可以看到完整范围。
技能创建过程
技能创建涉及这些步骤:
- 用具体示例理解技能
- 规划可重用技能内容(脚本、参考、资产)
- 初始化技能(运行 init_skill.py)
- 编辑技能(实现资源和编写 SKILL.md)
- 验证技能(运行 quick_validate.py)
- 基于实际使用迭代
按顺序遵循这些步骤,仅当有明确原因不适用时才跳过。
步骤 1:用具体示例理解技能
仅当技能的用法模式已清楚理解时才跳过此步骤。即使处理现有技能,它仍然有价值。
要创建有效技能,清楚理解技能将如何使用的具体示例。这种理解可以来自直接用户示例或经过用户反馈验证的生成示例。
例如,当构建图像编辑技能时,相关问题包括:
- “图像编辑技能应支持什么功能?编辑、旋转、还有其他吗?”
- “你能给出一些此技能将如何使用的示例吗?”
- “我可以想象用户要求‘从这张图片中移除红眼’或‘旋转这张图片’。你想象此技能还有哪些其他使用方式?”
- “用户说什么应触发此技能?”
为避免压倒用户,避免在单个消息中问太多问题。从最重要的问题开始,并根据需要跟进以提高效果。
当对技能应支持的功能有清晰感觉时,结束此步骤。
步骤 2:规划可重用技能内容
要将具体示例转化为有效技能,分析每个示例:
- 考虑如何从头开始执行示例
- 识别执行这些工作流程重复时哪些脚本、参考和资产会有帮助
示例:当构建 pdf-editor 技能处理查询如“帮我旋转此 PDF”时,分析显示:
- 旋转 PDF 需要每次重写相同代码
scripts/rotate_pdf.py脚本有助于存储在技能中
示例:当设计 frontend-webapp-builder 技能处理查询如“为我构建待办事项应用”或“为我构建跟踪步数的仪表板”时,分析显示:
- 编写前端 webapp 需要每次相同的样板 HTML/React
assets/hello-world/模板包含样板 HTML/React 项目文件有助于存储在技能中
示例:当构建 big-query 技能处理查询如“今天有多少用户登录?”时,分析显示:
- 查询 BigQuery 需要每次重新发现表模式和关系
references/schema.md文件记录表模式有助于存储在技能中
要建立技能的内容,分析每个具体示例以创建要包含的可重用资源列表:脚本、参考和资产。
步骤 3:初始化技能
此时,是时候实际创建技能了。
仅当正在开发的技能已存在且需要迭代或打包时才跳过此步骤。在这种情况下,继续到下一步。
有两种创建新技能的方式:
选项 A:init_skill.py(推荐用于丰富技能)
当从头创建新技能时,运行 init_skill.py 脚本。该脚本生成一个新的模板技能目录,自动包含技能所需的一切,使技能创建过程更高效和可靠。
用法:
scripts/init_skill.py <技能名称> --path <输出目录>
对于 deepagents CLI,使用上面“Deepagents 的技能位置”中列出的任何技能目录:
# 用户技能(默认)
scripts/init_skill.py <技能名称> --path ~/.deepagents/agent/skills
# 项目技能
scripts/init_skill.py <技能名称> --path .deepagents/skills
脚本:
- 在指定路径创建技能目录
- 生成具有适当前端和 TODO 占位符的 SKILL.md 模板
- 创建示例资源目录:
scripts/、references/和assets/ - 添加每个目录中的示例文件,可以自定义或删除
初始化后,根据需要自定义或删除生成的 SKILL.md 和示例文件。
选项 B:deepagents skills create(快速开始)
内置 CLI 命令创建仅带 SKILL.md 模板的最小技能——无资源目录。用于仅需要指令且无需捆绑脚本、参考或资产的简单技能。
# 在用户技能目录中创建
deepagents skills create <技能名称>
# 在项目技能目录中创建
deepagents skills create <技能名称> --project
当技能将包括捆绑资源(scripts/、references/、assets/)时,使用 init_skill.py。用于快速、最小起始点时,使用 deepagents skills create。
步骤 4:编辑技能
编辑(新生成或现有)技能时,记住技能是为代理使用而创建的。包含对代理有益且非显而易见的信息。考虑哪些程序性知识、领域特定细节或可重用资产将帮助代理更有效地执行这些任务。
学习已验证的设计模式
根据技能需求咨询这些有用指南:
- 多步骤过程:参见 references/workflows.md 获取顺序工作流程和条件逻辑
- 特定输出格式或质量标准:参见 references/output-patterns.md 获取模板和示例模式
这些文件包含有效技能设计的既定最佳实践。
从可重用技能内容开始
要开始实现,从上面识别的可重用资源开始:scripts/、references/ 和 assets/ 文件。注意,此步骤可能需要用户输入。例如,当实现 brand-guidelines 技能时,用户可能需要提供品牌资产或模板以存储在 assets/ 中,或文档存储在 references/ 中。
添加的脚本必须通过实际运行来测试,以确保没有错误且输出符合预期。如果有许多类似脚本,仅测试代表性样本以确保信心,同时平衡完成时间。
技能不需要的任何示例文件和目录应删除。初始化脚本在 scripts/、references/ 和 assets/ 中创建示例文件以演示结构,但大多数技能不需要所有。
更新 SKILL.md
写作指南:始终使用命令式/不定式形式。
前端元数据
用 name 和 description 编写 YAML 前端元数据:
name:技能名称description:这是技能的主要触发机制,帮助代理理解何时使用技能。- 包括技能做什么以及何时使用它的具体触发器/上下文。
- 在此处包括所有“何时使用”信息——不在正文中。正文仅在触发后加载,因此正文中的“何时使用此技能”部分对代理无帮助。
- 例如,
docx技能的描述:“全面的文档创建、编辑和分析,支持跟踪更改、评论、格式保留和文本提取。在专业文档(.docx 文件)工作时使用:(1) 创建新文档,(2) 修改或编辑内容,(3) 处理跟踪更改,(4) 添加评论,或任何其他文档任务”
不要在 YAML 前端元数据中包含任何其他字段。
正文
编写使用技能及其捆绑资源的指令。
步骤 5:验证技能
技能开发完成后,验证它以确保满足所有要求:
scripts/quick_validate.py <路径/到/技能-文件夹>
验证脚本检查:
- YAML 前端元数据格式和必需字段
- 技能命名约定(连字符-大小写,最大 64 字符)
- 描述完整性(无尖括号,最大 1024 字符)
- 必需字段:
name和description - 允许的前端元数据属性仅:
name,description,license,compatibility,allowed-tools,metadata
如果验证失败,修复报告的错误并再次运行验证命令。
步骤 6:迭代
测试技能后,用户可能请求改进。通常这在使用技能后立即发生,带有技能表现如何的新鲜上下文。
迭代工作流程:
- 在真实任务上使用技能
- 注意困难或低效
- 识别 SKILL.md 或捆绑资源应如何更新
- 实施更改并再次测试