名称：代理原生审计描述：运行全面的代理原生架构审查，附带评分原则

参数

[可选：指定要审计的原则]

代理原生架构审计

对代码库进行全面的代理原生架构原则审查，为每个原则启动并行子代理，并生成评分报告。

核心审计原则

操作对等性 - “用户能做的任何事，代理都能做”
工具作为原语 - “工具提供能力，而非行为”
上下文注入 - “系统提示包含应用状态的动态上下文”
共享工作空间 - “代理和用户在同一数据空间工作”
CRUD完整性 - “每个实体都有完整的CRUD（创建、读取、更新、删除）”
UI集成 - “代理操作立即在UI中反映”
能力发现 - “用户可以发现代理能做什么”
提示原生功能 - “功能是定义结果的提示，而非代码”

工作流程

步骤1：加载代理原生技能

首先，调用代理原生架构技能以理解所有原则：

/复合工程:代理原生架构

选择选项7（操作对等性）以加载完整参考材料。

步骤2：启动并行子代理

使用Task工具启动8个并行子代理，设置subagent_type: Explore，每个代理对应一个原则。每个代理应：

枚举代码库中的所有实例（用户操作、工具、上下文、数据存储等）
检查对原则的合规性
提供特定分数，如"X out of Y (percentage%)"
列出具体差距和建议

<子代理>

代理1：操作对等性

审计操作对等性 - "用户能做的任何事，代理都能做。"

任务：
1. 枚举前端中的所有用户操作（API调用、按钮点击、表单提交）
   - 搜索API服务文件、fetch调用、表单处理程序
   - 检查路由和组件的用户交互
2. 检查哪些有对应的代理工具
   - 搜索代理工具定义
   - 映射用户操作到代理能力
3. 分数："代理能做X out of Y用户操作"

格式：
## 操作对等性审计
### 找到的用户操作
| 操作 | 位置 | 代理工具 | 状态 |
### 分数：X/Y (percentage%)
### 缺失的代理工具
### 建议

代理2：工具作为原语

审计工具作为原语 - "工具提供能力，而非行为。"

任务：
1. 查找并读取所有代理工具文件
2. 将每个分类为：
   - 原语（好）：读取、写入、存储、列表 - 提供能力而无业务逻辑
   - 工作流（坏）：编码业务逻辑、做出决策、编排步骤
3. 分数："X out of Y工具是适当的原语"

格式：
## 工具作为原语审计
### 工具分析
| 工具 | 文件 | 类型 | 理由 |
### 分数：X/Y (percentage%)
### 问题工具（应为原语的工作流）
### 建议

代理3：上下文注入

审计上下文注入 - "系统提示包含应用状态的动态上下文"

任务：
1. 查找上下文注入代码（搜索"上下文"、"系统提示"、"注入"）
2. 读取代理提示和系统消息
3. 枚举已注入与应注入的内容：
   - 可用资源（文件、草稿、文档）
   - 用户偏好/设置
   - 最近活动
   - 列出可用能力
   - 会话历史
   - 工作空间状态

格式：
## 上下文注入审计
### 上下文类型分析
| 上下文类型 | 是否注入？ | 位置 | 注释 |
### 分数：X/Y (percentage%)
### 缺失的上下文
### 建议

代理4：共享工作空间

审计共享工作空间 - "代理和用户在同一数据空间工作"

任务：
1. 识别所有数据存储/表/模型
2. 检查代理是否读取/写入相同表或单独表
3. 查找沙箱隔离反模式（代理有单独数据空间）

格式：
## 共享工作空间审计
### 数据存储分析
| 数据存储 | 用户访问 | 代理访问 | 是否共享？ |
### 分数：X/Y (percentage%)
### 隔离的数据（反模式）
### 建议

代理5：CRUD完整性

审计CRUD完整性 - "每个实体都有完整的CRUD"

任务：
1. 识别代码库中的所有实体/模型
2. 对于每个实体，检查是否存在代理工具用于：
   - 创建
   - 读取
   - 更新
   - 删除
3. 按实体和整体评分

格式：
## CRUD完整性审计
### 实体CRUD分析
| 实体 | 创建 | 读取 | 更新 | 删除 | 分数 |
### 整体分数：X/Y个实体具有完整CRUD (percentage%)
### 不完整的实体（列出缺失的操作）
### 建议

代理6：UI集成

审计UI集成 - "代理操作立即在UI中反映"

任务：
1. 检查代理写入/更改如何传播到前端
2. 查找：
   - 流式更新（SSE、WebSocket）
   - 轮询机制
   - 共享状态/服务
   - 事件总线
   - 文件监视
3. 识别"静默操作"反模式（代理更改状态但UI不更新）

格式：
## UI集成审计
### 代理操作 → UI更新分析
| 代理操作 | UI机制 | 是否立即？ | 注释 |
### 分数：X/Y (percentage%)
### 静默操作（反模式）
### 建议

代理7：能力发现

审计能力发现 - "用户可以发现代理能做什么"

任务：
1. 检查这7种发现机制：
   - 展示代理能力的入门流程
   - 帮助文档
   - UI中的能力提示
   - 代理在响应中自我描述
   - 建议的提示/操作
   - 空状态指导
   - 斜杠命令（/help、/tools）
2. 针对7种机制评分

格式：
## 能力发现审计
### 发现机制分析
| 机制 | 是否存在？ | 位置 | 质量 |
### 分数：X/7 (percentage%)
### 缺失的发现
### 建议

代理8：提示原生功能

审计提示原生功能 - "功能是定义结果的提示，而非代码"

任务：
1. 读取所有代理提示
2. 将每个功能/行为分类为定义在：
   - 提示（好）：结果用自然语言定义
   - 代码（坏）：业务逻辑硬编码
3. 检查行为更改是否需要提示编辑与代码更改

格式：
## 提示原生功能审计
### 功能定义分析
| 功能 | 定义在 | 类型 | 注释 |
### 分数：X/Y (percentage%)
### 代码定义的功能（反模式）
### 建议

</子代理>

步骤3：编译摘要报告

所有代理完成后，编译摘要：

## 代理原生架构审查：[项目名称]

### 整体分数摘要

| 核心原则 | 分数 | 百分比 | 状态 |
|----------------|-------|------------|--------|
| 操作对等性 | X/Y | Z% | ✅/⚠️/❌ |
| 工具作为原语 | X/Y | Z% | ✅/⚠️/❌ |
| 上下文注入 | X/Y | Z% | ✅/⚠️/❌ |
| 共享工作空间 | X/Y | Z% | ✅/⚠️/❌ |
| CRUD完整性 | X/Y | Z% | ✅/⚠️/❌ |
| UI集成 | X/Y | Z% | ✅/⚠️/❌ |
| 能力发现 | X/Y | Z% | ✅/⚠️/❌ |
| 提示原生功能 | X/Y | Z% | ✅/⚠️/❌ |

**整体代理原生分数：X%**

### 状态图例
- ✅ 优秀 (80%+)
- ⚠️ 部分 (50-79%)
- ❌ 需要改进 (<50%)

### 按影响力排序的前10条建议

| 优先级 | 行动 | 原则 | 努力程度 |
|----------|--------|-----------|--------|

### 哪些方面表现优秀

[列出前5个优点]

成功标准

[ ] 所有8个子代理完成审计
[ ] 每个原则有特定数字分数（X/Y格式）
[ ] 摘要表显示所有分数和状态指示器
[ ] 前10条建议按影响力优先级排序
[ ] 报告识别优点和差距

可选：单一原则审计

如果$ARGUMENTS指定单个原则（例如"操作对等性"），则仅运行该子代理并提供该原则的详细发现。

有效参数：

操作对等性 或 1
工具 或 原语 或 2
上下文 或 注入 或 3
共享 或 工作空间 或 4
crud 或 5
ui 或 集成 或 6
发现 或 7
提示 或 功能 或 8

名称：代理原生审计 描述：运行全面的代理原生架构审查，附带评分原则

参数