name: 技能升级器 description: 使用决策理论+模态逻辑将任何技能升级到v5 Hybrid格式 allowed-tools: [Bash, Read, Write, Edit, Task, Glob, Grep]

技能升级器

元技能，使用4个并行Ragie支持的代理将任何SKILL.md升级到决策理论v5 Hybrid格式。

何时使用

“将此技能升级到v5”
“使用决策理论形式化此技能”
“为此技能添加MDP结构”
“对X应用技能升级器”

先决条件

Ragie RAG索引书籍：

决策理论分区：LaValle《规划算法》、Sutton & Barto《强化学习》
模态逻辑分区：Blackburn《模态逻辑》、Huth & Ryan《计算机科学中的逻辑》

工作流程

步骤1：设置会话

SESSION=$(date +%Y%m%d-%H%M%S)-upgrade-{skill_name}
mkdir -p thoughts/skill-builds/${SESSION}

步骤2：初始化黑板

创建 thoughts/skill-builds/{session}/00-blackboard.md：

# 技能升级：{skill_name}
开始时间：{timestamp}

## 输入技能
{path_to_skill}

## 目标格式
决策理论v5 Hybrid

## 代理发现
（代理在下方追加）

---

步骤3：并行启动4个代理

使用Task工具同时生成所有4个代理。每个代理：

读取输入技能
查询Ragie获取特定书籍
将发现追加到黑板

代理1：LaValle规划器

书籍： LaValle《规划算法》（决策理论分区） 重点： 状态、动作、转移

Task(
  subagent_type="general-purpose",
  prompt="""
输入技能：{path}
黑板：thoughts/skill-builds/{session}/00-blackboard.md

您的书籍：Ragie分区'decision-theory'中的LaValle《规划算法》

任务：识别技能中的MDP结构。

查询Ragie：
```bash
uv run python scripts/ragie_query.py -q "MDP状态空间定义" -p decision-theory
uv run python scripts/ragie_query.py -q "动作空间序列决策" -p decision-theory
uv run python scripts/ragie_query.py -q "POMDP部分可观测性" -p decision-theory

读取输入技能并回答：

状态是什么？（阶段、模式、跟踪信息）
动作是什么？（代理在每个状态下能做什么）
转移如何工作？（确定性或随机性）
这是POMDP还是完全可观测？

写入黑板部分：## 代理1：状态、动作与转移

格式为纯英文，引用LaValle章节。 “”" )


---

## 代理2：Sutton & Barto优化器

**书籍：** Sutton & Barto《强化学习》（决策理论分区）
**重点：** 策略、终止、价值
**依赖：** 代理1

Task( subagent_type=“general-purpose”, prompt=“”" 输入技能：{path} 黑板：thoughts/skill-builds/{session}/00-blackboard.md

您的书籍：Ragie分区’decision-theory’中的Sutton & Barto《强化学习》

等待：首先从黑板读取代理1的发现。

任务：设计策略和终止条件。

查询Ragie：

uv run python scripts/ragie_query.py -q "策略确定性随机性" -p decision-theory
uv run python scripts/ragie_query.py -q "情景终止条件" -p decision-theory
uv run python scripts/ragie_query.py -q "奖励函数设计" -p decision-theory

使用代理1的状态和动作，回答：

策略是什么？（状态→动作规则）
何时结束？（终端状态、成功/失败）
奖励是什么？（目标+、成本-）
哪些状态具有高/低价值？

写入黑板部分：## 代理2：策略与价值

格式为纯英文，引用Sutton & Barto部分。 “”" )


---

## 代理3：Blackburn模态逻辑学家

**书籍：** Blackburn《模态逻辑》（模态逻辑分区）
**重点：** 约束（时态、认知、道义）

Task( subagent_type=“general-purpose”, prompt=“”" 输入技能：{path} 黑板：thoughts/skill-builds/{session}/00-blackboard.md

您的书籍：Ragie分区’modal-logic’中的Blackburn《模态逻辑》

任务：从技能中提取约束。

查询Ragie：

uv run python scripts/ragie_query.py -q "时态逻辑LTL操作符" -p modal-logic
uv run python scripts/ragie_query.py -q "认知逻辑知识" -p modal-logic
uv run python scripts/ragie_query.py -q "道义逻辑义务" -p modal-logic

读取输入技能并识别：

时态：“必须在Y之前做X” → □、◇、U
认知：“必须知道X” → K操作符
道义：“必须/禁止/可以” → O、F、P
动态：“动作导致效果” → [动作]

写入黑板部分：## 代理3：约束

对于每个约束：

纯英文描述
模态逻辑符号
为什么重要
引用Blackburn章节 “”" )


---

## 代理4：Huth & Ryan验证器

**书籍：** Huth & Ryan《计算机科学中的逻辑》（模态逻辑分区）
**重点：** 验证、安全性、活性
**依赖：** 代理1-3

Task( subagent_type=“general-purpose”, prompt=“”" 输入技能：{path} 黑板：thoughts/skill-builds/{session}/00-blackboard.md

您的书籍：Ragie分区’modal-logic’中的Huth & Ryan《计算机科学中的逻辑》

等待：首先从黑板读取代理1-3的发现。

任务：验证一致性和完整性。

查询Ragie：

uv run python scripts/ragie_query.py -q "安全性属性验证" -p modal-logic
uv run python scripts/ragie_query.py -q "活性属性最终性" -p modal-logic
uv run python scripts/ragie_query.py -q "模型检查CTL" -p modal-logic

检查：

安全性：哪些坏事从不发生？ □¬(bad)
活性：哪些好事最终发生？ ◇(good)
一致性：代理之间是否有矛盾？
完整性：是否有覆盖缺口？

写入黑板部分：## 代理4：验证

报告每个属性的✓/✗。总体裁决：通过或需要改进引用Huth & Ryan部分。 “”" )


---

## 步骤4：合成最终技能

所有代理完成后，读取黑板并创建：

**输出：** `thoughts/skill-builds/{session}/SKILL-upgraded.md`

使用v5 Hybrid模板：

```yaml
---
name: {original_name}
description: {original_description}
version: 5.1-hybrid
---

# 选项：{name}

## 初始化 (I)
[来自原始+代理1状态分析]

## 观测空间 (Y)
[来自代理1 POMDP分析]

## 动作空间 (U)
[来自代理1动作]

## 策略 (pi)
[来自代理2状态→动作规则]

## 终止 (beta)
[来自代理2情景结构]

## Q启发式
[来自代理2价值指导]

## 约束
[来自代理3模态逻辑]

## 验证
[来自代理4安全性/活性]

示例用法

用户："将.claude/skills/implement_plan/SKILL.md升级到v5 Hybrid"

Claude：
1. 创建会话目录
2. 初始化黑板
3. 并行启动4个代理（Task工具）
4. 等待完成
5. 读取黑板
6. 合成升级后的技能
7. 报告："升级后的技能位于thoughts/skill-builds/.../SKILL-upgraded.md"

Ragie查询参考

# 决策理论分区
uv run python scripts/ragie_query.py -q "您的问题" -p decision-theory

# 模态逻辑分区
uv run python scripts/ragie_query.py -q "您的问题" -p modal-logic

# 使用重排以获得更好结果
uv run python scripts/ragie_query.py -q "您的问题" -p decision-theory --rerank

创建的文件

升级后：

thoughts/skill-builds/{session}/
├── 00-blackboard.md      # 代理协作
├── SKILL-upgraded.md     # 最终v5 Hybrid技能
└── validation-report.md  # 代理4验证报告