名称:代理原生审计 描述:运行全面的代理原生架构审查,附带评分原则
参数
[可选:指定要审计的原则]
代理原生架构审计
对代码库进行全面的代理原生架构原则审查,为每个原则启动并行子代理,并生成评分报告。
核心审计原则
- 操作对等性 - “用户能做的任何事,代理都能做”
- 工具作为原语 - “工具提供能力,而非行为”
- 上下文注入 - “系统提示包含应用状态的动态上下文”
- 共享工作空间 - “代理和用户在同一数据空间工作”
- CRUD完整性 - “每个实体都有完整的CRUD(创建、读取、更新、删除)”
- UI集成 - “代理操作立即在UI中反映”
- 能力发现 - “用户可以发现代理能做什么”
- 提示原生功能 - “功能是定义结果的提示,而非代码”
工作流程
步骤1:加载代理原生技能
首先,调用代理原生架构技能以理解所有原则:
/复合工程:代理原生架构
选择选项7(操作对等性)以加载完整参考材料。
步骤2:启动并行子代理
使用Task工具启动8个并行子代理,设置subagent_type: Explore,每个代理对应一个原则。每个代理应:
- 枚举代码库中的所有实例(用户操作、工具、上下文、数据存储等)
- 检查对原则的合规性
- 提供特定分数,如"X out of Y (percentage%)"
- 列出具体差距和建议
<子代理>
代理1:操作对等性
审计操作对等性 - "用户能做的任何事,代理都能做。"
任务:
1. 枚举前端中的所有用户操作(API调用、按钮点击、表单提交)
- 搜索API服务文件、fetch调用、表单处理程序
- 检查路由和组件的用户交互
2. 检查哪些有对应的代理工具
- 搜索代理工具定义
- 映射用户操作到代理能力
3. 分数:"代理能做X out of Y用户操作"
格式:
## 操作对等性审计
### 找到的用户操作
| 操作 | 位置 | 代理工具 | 状态 |
### 分数:X/Y (percentage%)
### 缺失的代理工具
### 建议
代理2:工具作为原语
审计工具作为原语 - "工具提供能力,而非行为。"
任务:
1. 查找并读取所有代理工具文件
2. 将每个分类为:
- 原语(好):读取、写入、存储、列表 - 提供能力而无业务逻辑
- 工作流(坏):编码业务逻辑、做出决策、编排步骤
3. 分数:"X out of Y工具是适当的原语"
格式:
## 工具作为原语审计
### 工具分析
| 工具 | 文件 | 类型 | 理由 |
### 分数:X/Y (percentage%)
### 问题工具(应为原语的工作流)
### 建议
代理3:上下文注入
审计上下文注入 - "系统提示包含应用状态的动态上下文"
任务:
1. 查找上下文注入代码(搜索"上下文"、"系统提示"、"注入")
2. 读取代理提示和系统消息
3. 枚举已注入与应注入的内容:
- 可用资源(文件、草稿、文档)
- 用户偏好/设置
- 最近活动
- 列出可用能力
- 会话历史
- 工作空间状态
格式:
## 上下文注入审计
### 上下文类型分析
| 上下文类型 | 是否注入? | 位置 | 注释 |
### 分数:X/Y (percentage%)
### 缺失的上下文
### 建议
代理4:共享工作空间
审计共享工作空间 - "代理和用户在同一数据空间工作"
任务:
1. 识别所有数据存储/表/模型
2. 检查代理是否读取/写入相同表或单独表
3. 查找沙箱隔离反模式(代理有单独数据空间)
格式:
## 共享工作空间审计
### 数据存储分析
| 数据存储 | 用户访问 | 代理访问 | 是否共享? |
### 分数:X/Y (percentage%)
### 隔离的数据(反模式)
### 建议
代理5:CRUD完整性
审计CRUD完整性 - "每个实体都有完整的CRUD"
任务:
1. 识别代码库中的所有实体/模型
2. 对于每个实体,检查是否存在代理工具用于:
- 创建
- 读取
- 更新
- 删除
3. 按实体和整体评分
格式:
## CRUD完整性审计
### 实体CRUD分析
| 实体 | 创建 | 读取 | 更新 | 删除 | 分数 |
### 整体分数:X/Y个实体具有完整CRUD (percentage%)
### 不完整的实体(列出缺失的操作)
### 建议
代理6:UI集成
审计UI集成 - "代理操作立即在UI中反映"
任务:
1. 检查代理写入/更改如何传播到前端
2. 查找:
- 流式更新(SSE、WebSocket)
- 轮询机制
- 共享状态/服务
- 事件总线
- 文件监视
3. 识别"静默操作"反模式(代理更改状态但UI不更新)
格式:
## UI集成审计
### 代理操作 → UI更新分析
| 代理操作 | UI机制 | 是否立即? | 注释 |
### 分数:X/Y (percentage%)
### 静默操作(反模式)
### 建议
代理7:能力发现
审计能力发现 - "用户可以发现代理能做什么"
任务:
1. 检查这7种发现机制:
- 展示代理能力的入门流程
- 帮助文档
- UI中的能力提示
- 代理在响应中自我描述
- 建议的提示/操作
- 空状态指导
- 斜杠命令(/help、/tools)
2. 针对7种机制评分
格式:
## 能力发现审计
### 发现机制分析
| 机制 | 是否存在? | 位置 | 质量 |
### 分数:X/7 (percentage%)
### 缺失的发现
### 建议
代理8:提示原生功能
审计提示原生功能 - "功能是定义结果的提示,而非代码"
任务:
1. 读取所有代理提示
2. 将每个功能/行为分类为定义在:
- 提示(好):结果用自然语言定义
- 代码(坏):业务逻辑硬编码
3. 检查行为更改是否需要提示编辑与代码更改
格式:
## 提示原生功能审计
### 功能定义分析
| 功能 | 定义在 | 类型 | 注释 |
### 分数:X/Y (percentage%)
### 代码定义的功能(反模式)
### 建议
</子代理>
步骤3:编译摘要报告
所有代理完成后,编译摘要:
## 代理原生架构审查:[项目名称]
### 整体分数摘要
| 核心原则 | 分数 | 百分比 | 状态 |
|----------------|-------|------------|--------|
| 操作对等性 | X/Y | Z% | ✅/⚠️/❌ |
| 工具作为原语 | X/Y | Z% | ✅/⚠️/❌ |
| 上下文注入 | X/Y | Z% | ✅/⚠️/❌ |
| 共享工作空间 | X/Y | Z% | ✅/⚠️/❌ |
| CRUD完整性 | X/Y | Z% | ✅/⚠️/❌ |
| UI集成 | X/Y | Z% | ✅/⚠️/❌ |
| 能力发现 | X/Y | Z% | ✅/⚠️/❌ |
| 提示原生功能 | X/Y | Z% | ✅/⚠️/❌ |
**整体代理原生分数:X%**
### 状态图例
- ✅ 优秀 (80%+)
- ⚠️ 部分 (50-79%)
- ❌ 需要改进 (<50%)
### 按影响力排序的前10条建议
| 优先级 | 行动 | 原则 | 努力程度 |
|----------|--------|-----------|--------|
### 哪些方面表现优秀
[列出前5个优点]
成功标准
- [ ] 所有8个子代理完成审计
- [ ] 每个原则有特定数字分数(X/Y格式)
- [ ] 摘要表显示所有分数和状态指示器
- [ ] 前10条建议按影响力优先级排序
- [ ] 报告识别优点和差距
可选:单一原则审计
如果$ARGUMENTS指定单个原则(例如"操作对等性"),则仅运行该子代理并提供该原则的详细发现。
有效参数:
操作对等性或1工具或原语或2上下文或注入或3共享或工作空间或4crud或5ui或集成或6发现或7提示或功能或8