name: 技能升级器 description: 使用决策理论+模态逻辑将任何技能升级到v5 Hybrid格式 allowed-tools: [Bash, Read, Write, Edit, Task, Glob, Grep]
技能升级器
元技能,使用4个并行Ragie支持的代理将任何SKILL.md升级到决策理论v5 Hybrid格式。
何时使用
- “将此技能升级到v5”
- “使用决策理论形式化此技能”
- “为此技能添加MDP结构”
- “对X应用技能升级器”
先决条件
Ragie RAG索引书籍:
- 决策理论分区:LaValle《规划算法》、Sutton & Barto《强化学习》
- 模态逻辑分区:Blackburn《模态逻辑》、Huth & Ryan《计算机科学中的逻辑》
工作流程
步骤1:设置会话
SESSION=$(date +%Y%m%d-%H%M%S)-upgrade-{skill_name}
mkdir -p thoughts/skill-builds/${SESSION}
步骤2:初始化黑板
创建 thoughts/skill-builds/{session}/00-blackboard.md:
# 技能升级:{skill_name}
开始时间:{timestamp}
## 输入技能
{path_to_skill}
## 目标格式
决策理论v5 Hybrid
## 代理发现
(代理在下方追加)
---
步骤3:并行启动4个代理
使用Task工具同时生成所有4个代理。每个代理:
- 读取输入技能
- 查询Ragie获取特定书籍
- 将发现追加到黑板
代理1:LaValle规划器
书籍: LaValle《规划算法》(决策理论分区) 重点: 状态、动作、转移
Task(
subagent_type="general-purpose",
prompt="""
输入技能:{path}
黑板:thoughts/skill-builds/{session}/00-blackboard.md
您的书籍:Ragie分区'decision-theory'中的LaValle《规划算法》
任务:识别技能中的MDP结构。
查询Ragie:
```bash
uv run python scripts/ragie_query.py -q "MDP状态空间定义" -p decision-theory
uv run python scripts/ragie_query.py -q "动作空间序列决策" -p decision-theory
uv run python scripts/ragie_query.py -q "POMDP部分可观测性" -p decision-theory
读取输入技能并回答:
- 状态是什么?(阶段、模式、跟踪信息)
- 动作是什么?(代理在每个状态下能做什么)
- 转移如何工作?(确定性或随机性)
- 这是POMDP还是完全可观测?
写入黑板部分:## 代理1:状态、动作与转移
格式为纯英文,引用LaValle章节。 “”" )
---
## 代理2:Sutton & Barto优化器
**书籍:** Sutton & Barto《强化学习》(决策理论分区)
**重点:** 策略、终止、价值
**依赖:** 代理1
Task( subagent_type=“general-purpose”, prompt=“”" 输入技能:{path} 黑板:thoughts/skill-builds/{session}/00-blackboard.md
您的书籍:Ragie分区’decision-theory’中的Sutton & Barto《强化学习》
等待:首先从黑板读取代理1的发现。
任务:设计策略和终止条件。
查询Ragie:
uv run python scripts/ragie_query.py -q "策略确定性随机性" -p decision-theory
uv run python scripts/ragie_query.py -q "情景终止条件" -p decision-theory
uv run python scripts/ragie_query.py -q "奖励函数设计" -p decision-theory
使用代理1的状态和动作,回答:
- 策略是什么?(状态→动作规则)
- 何时结束?(终端状态、成功/失败)
- 奖励是什么?(目标+、成本-)
- 哪些状态具有高/低价值?
写入黑板部分:## 代理2:策略与价值
格式为纯英文,引用Sutton & Barto部分。 “”" )
---
## 代理3:Blackburn模态逻辑学家
**书籍:** Blackburn《模态逻辑》(模态逻辑分区)
**重点:** 约束(时态、认知、道义)
Task( subagent_type=“general-purpose”, prompt=“”" 输入技能:{path} 黑板:thoughts/skill-builds/{session}/00-blackboard.md
您的书籍:Ragie分区’modal-logic’中的Blackburn《模态逻辑》
任务:从技能中提取约束。
查询Ragie:
uv run python scripts/ragie_query.py -q "时态逻辑LTL操作符" -p modal-logic
uv run python scripts/ragie_query.py -q "认知逻辑知识" -p modal-logic
uv run python scripts/ragie_query.py -q "道义逻辑义务" -p modal-logic
读取输入技能并识别:
- 时态:“必须在Y之前做X” → □、◇、U
- 认知:“必须知道X” → K操作符
- 道义:“必须/禁止/可以” → O、F、P
- 动态:“动作导致效果” → [动作]
写入黑板部分:## 代理3:约束
对于每个约束:
- 纯英文描述
- 模态逻辑符号
- 为什么重要
- 引用Blackburn章节 “”" )
---
## 代理4:Huth & Ryan验证器
**书籍:** Huth & Ryan《计算机科学中的逻辑》(模态逻辑分区)
**重点:** 验证、安全性、活性
**依赖:** 代理1-3
Task( subagent_type=“general-purpose”, prompt=“”" 输入技能:{path} 黑板:thoughts/skill-builds/{session}/00-blackboard.md
您的书籍:Ragie分区’modal-logic’中的Huth & Ryan《计算机科学中的逻辑》
等待:首先从黑板读取代理1-3的发现。
任务:验证一致性和完整性。
查询Ragie:
uv run python scripts/ragie_query.py -q "安全性属性验证" -p modal-logic
uv run python scripts/ragie_query.py -q "活性属性最终性" -p modal-logic
uv run python scripts/ragie_query.py -q "模型检查CTL" -p modal-logic
检查:
- 安全性:哪些坏事从不发生? □¬(bad)
- 活性:哪些好事最终发生? ◇(good)
- 一致性:代理之间是否有矛盾?
- 完整性:是否有覆盖缺口?
写入黑板部分:## 代理4:验证
报告每个属性的✓/✗。 总体裁决:通过或需要改进 引用Huth & Ryan部分。 “”" )
---
## 步骤4:合成最终技能
所有代理完成后,读取黑板并创建:
**输出:** `thoughts/skill-builds/{session}/SKILL-upgraded.md`
使用v5 Hybrid模板:
```yaml
---
name: {original_name}
description: {original_description}
version: 5.1-hybrid
---
# 选项:{name}
## 初始化 (I)
[来自原始+代理1状态分析]
## 观测空间 (Y)
[来自代理1 POMDP分析]
## 动作空间 (U)
[来自代理1动作]
## 策略 (pi)
[来自代理2状态→动作规则]
## 终止 (beta)
[来自代理2情景结构]
## Q启发式
[来自代理2价值指导]
## 约束
[来自代理3模态逻辑]
## 验证
[来自代理4安全性/活性]
示例用法
用户:"将.claude/skills/implement_plan/SKILL.md升级到v5 Hybrid"
Claude:
1. 创建会话目录
2. 初始化黑板
3. 并行启动4个代理(Task工具)
4. 等待完成
5. 读取黑板
6. 合成升级后的技能
7. 报告:"升级后的技能位于thoughts/skill-builds/.../SKILL-upgraded.md"
Ragie查询参考
# 决策理论分区
uv run python scripts/ragie_query.py -q "您的问题" -p decision-theory
# 模态逻辑分区
uv run python scripts/ragie_query.py -q "您的问题" -p modal-logic
# 使用重排以获得更好结果
uv run python scripts/ragie_query.py -q "您的问题" -p decision-theory --rerank
创建的文件
升级后:
thoughts/skill-builds/{session}/
├── 00-blackboard.md # 代理协作
├── SKILL-upgraded.md # 最终v5 Hybrid技能
└── validation-report.md # 代理4验证报告