代理原生架构审计Skill agent-native-audit

这个技能用于执行代理原生架构的全面审查,通过并行子代理对八个核心原则进行评分和报告。它帮助开发者和架构师评估代码库是否符合代理原生设计原则,识别差距并提供改进建议。关键词:代理原生、架构审计、AI智能体、代码审查、评分报告、原则检查、软件架构、智能代理。

AI智能体 0 次安装 0 次浏览 更新于 3/9/2026

名称:代理原生审计 描述:运行全面的代理原生架构审查,附带评分原则

参数

[可选:指定要审计的原则]

代理原生架构审计

对代码库进行全面的代理原生架构原则审查,为每个原则启动并行子代理,并生成评分报告。

核心审计原则

  1. 操作对等性 - “用户能做的任何事,代理都能做”
  2. 工具作为原语 - “工具提供能力,而非行为”
  3. 上下文注入 - “系统提示包含应用状态的动态上下文”
  4. 共享工作空间 - “代理和用户在同一数据空间工作”
  5. CRUD完整性 - “每个实体都有完整的CRUD(创建、读取、更新、删除)”
  6. UI集成 - “代理操作立即在UI中反映”
  7. 能力发现 - “用户可以发现代理能做什么”
  8. 提示原生功能 - “功能是定义结果的提示,而非代码”

工作流程

步骤1:加载代理原生技能

首先,调用代理原生架构技能以理解所有原则:

/复合工程:代理原生架构

选择选项7(操作对等性)以加载完整参考材料。

步骤2:启动并行子代理

使用Task工具启动8个并行子代理,设置subagent_type: Explore,每个代理对应一个原则。每个代理应:

  1. 枚举代码库中的所有实例(用户操作、工具、上下文、数据存储等)
  2. 检查对原则的合规性
  3. 提供特定分数,如"X out of Y (percentage%)"
  4. 列出具体差距和建议

<子代理>

代理1:操作对等性

审计操作对等性 - "用户能做的任何事,代理都能做。"

任务:
1. 枚举前端中的所有用户操作(API调用、按钮点击、表单提交)
   - 搜索API服务文件、fetch调用、表单处理程序
   - 检查路由和组件的用户交互
2. 检查哪些有对应的代理工具
   - 搜索代理工具定义
   - 映射用户操作到代理能力
3. 分数:"代理能做X out of Y用户操作"

格式:
## 操作对等性审计
### 找到的用户操作
| 操作 | 位置 | 代理工具 | 状态 |
### 分数:X/Y (percentage%)
### 缺失的代理工具
### 建议

代理2:工具作为原语

审计工具作为原语 - "工具提供能力,而非行为。"

任务:
1. 查找并读取所有代理工具文件
2. 将每个分类为:
   - 原语(好):读取、写入、存储、列表 - 提供能力而无业务逻辑
   - 工作流(坏):编码业务逻辑、做出决策、编排步骤
3. 分数:"X out of Y工具是适当的原语"

格式:
## 工具作为原语审计
### 工具分析
| 工具 | 文件 | 类型 | 理由 |
### 分数:X/Y (percentage%)
### 问题工具(应为原语的工作流)
### 建议

代理3:上下文注入

审计上下文注入 - "系统提示包含应用状态的动态上下文"

任务:
1. 查找上下文注入代码(搜索"上下文"、"系统提示"、"注入")
2. 读取代理提示和系统消息
3. 枚举已注入与应注入的内容:
   - 可用资源(文件、草稿、文档)
   - 用户偏好/设置
   - 最近活动
   - 列出可用能力
   - 会话历史
   - 工作空间状态

格式:
## 上下文注入审计
### 上下文类型分析
| 上下文类型 | 是否注入? | 位置 | 注释 |
### 分数:X/Y (percentage%)
### 缺失的上下文
### 建议

代理4:共享工作空间

审计共享工作空间 - "代理和用户在同一数据空间工作"

任务:
1. 识别所有数据存储/表/模型
2. 检查代理是否读取/写入相同表或单独表
3. 查找沙箱隔离反模式(代理有单独数据空间)

格式:
## 共享工作空间审计
### 数据存储分析
| 数据存储 | 用户访问 | 代理访问 | 是否共享? |
### 分数:X/Y (percentage%)
### 隔离的数据(反模式)
### 建议

代理5:CRUD完整性

审计CRUD完整性 - "每个实体都有完整的CRUD"

任务:
1. 识别代码库中的所有实体/模型
2. 对于每个实体,检查是否存在代理工具用于:
   - 创建
   - 读取
   - 更新
   - 删除
3. 按实体和整体评分

格式:
## CRUD完整性审计
### 实体CRUD分析
| 实体 | 创建 | 读取 | 更新 | 删除 | 分数 |
### 整体分数:X/Y个实体具有完整CRUD (percentage%)
### 不完整的实体(列出缺失的操作)
### 建议

代理6:UI集成

审计UI集成 - "代理操作立即在UI中反映"

任务:
1. 检查代理写入/更改如何传播到前端
2. 查找:
   - 流式更新(SSE、WebSocket)
   - 轮询机制
   - 共享状态/服务
   - 事件总线
   - 文件监视
3. 识别"静默操作"反模式(代理更改状态但UI不更新)

格式:
## UI集成审计
### 代理操作 → UI更新分析
| 代理操作 | UI机制 | 是否立即? | 注释 |
### 分数:X/Y (percentage%)
### 静默操作(反模式)
### 建议

代理7:能力发现

审计能力发现 - "用户可以发现代理能做什么"

任务:
1. 检查这7种发现机制:
   - 展示代理能力的入门流程
   - 帮助文档
   - UI中的能力提示
   - 代理在响应中自我描述
   - 建议的提示/操作
   - 空状态指导
   - 斜杠命令(/help、/tools)
2. 针对7种机制评分

格式:
## 能力发现审计
### 发现机制分析
| 机制 | 是否存在? | 位置 | 质量 |
### 分数:X/7 (percentage%)
### 缺失的发现
### 建议

代理8:提示原生功能

审计提示原生功能 - "功能是定义结果的提示,而非代码"

任务:
1. 读取所有代理提示
2. 将每个功能/行为分类为定义在:
   - 提示(好):结果用自然语言定义
   - 代码(坏):业务逻辑硬编码
3. 检查行为更改是否需要提示编辑与代码更改

格式:
## 提示原生功能审计
### 功能定义分析
| 功能 | 定义在 | 类型 | 注释 |
### 分数:X/Y (percentage%)
### 代码定义的功能(反模式)
### 建议

</子代理>

步骤3:编译摘要报告

所有代理完成后,编译摘要:

## 代理原生架构审查:[项目名称]

### 整体分数摘要

| 核心原则 | 分数 | 百分比 | 状态 |
|----------------|-------|------------|--------|
| 操作对等性 | X/Y | Z% | ✅/⚠️/❌ |
| 工具作为原语 | X/Y | Z% | ✅/⚠️/❌ |
| 上下文注入 | X/Y | Z% | ✅/⚠️/❌ |
| 共享工作空间 | X/Y | Z% | ✅/⚠️/❌ |
| CRUD完整性 | X/Y | Z% | ✅/⚠️/❌ |
| UI集成 | X/Y | Z% | ✅/⚠️/❌ |
| 能力发现 | X/Y | Z% | ✅/⚠️/❌ |
| 提示原生功能 | X/Y | Z% | ✅/⚠️/❌ |

**整体代理原生分数:X%**

### 状态图例
- ✅ 优秀 (80%+)
- ⚠️ 部分 (50-79%)
- ❌ 需要改进 (<50%)

### 按影响力排序的前10条建议

| 优先级 | 行动 | 原则 | 努力程度 |
|----------|--------|-----------|--------|

### 哪些方面表现优秀

[列出前5个优点]

成功标准

  • [ ] 所有8个子代理完成审计
  • [ ] 每个原则有特定数字分数(X/Y格式)
  • [ ] 摘要表显示所有分数和状态指示器
  • [ ] 前10条建议按影响力优先级排序
  • [ ] 报告识别优点和差距

可选:单一原则审计

如果$ARGUMENTS指定单个原则(例如"操作对等性"),则仅运行该子代理并提供该原则的详细发现。

有效参数:

  • 操作对等性1
  • 工具原语2
  • 上下文注入3
  • 共享工作空间4
  • crud5
  • ui集成6
  • 发现7
  • 提示功能8