name: screenshot-feature-extractor description: “分析产品屏幕截图以提取功能列表并生成开发任务清单。使用场景:(1) 分析竞争对手产品屏幕截图进行特征提取,(2) 从UI设计中生成PRD/任务列表,(3) 批量分析多个应用屏幕,(4) 通过视觉参考进行竞争分析。”
屏幕截图分析器(多代理系统)
使用协调的多代理分析管道从UI屏幕截图中提取产品特征。
核心原则:描述要构建什么(特征/交互),而不是如何构建(不涉及技术栈)。
多代理架构
该技能协调5个专门代理进行综合分析:
┌─────────────────┐
│ 协调器 │
│ (此技能) │
└────────┬────────┘
│
┌───────────────────┼───────────────────┐
│ │ │
▼ ▼ ▼
┌─────────────────┐ ┌─────────────────┐ ┌─────────────────┐
│ UI分析器 │ │ 交互分析器 │ │ 业务分析器 │
│ (并行) │ │ (并行) │ │ (并行) │
│ │ │ │ │ │
└────────┬────────┘ └────────┬────────┘ └────────┬────────┘
│ │ │
└───────────────────┼───────────────────┘
▼
┌─────────────────┐
│ 合成器 │
│ (顺序) │
└────────┬────────┘
│
▼
┌─────────────────┐
│ 审阅器 │
│ (顺序) │
└─────────────────┘
过程
阶段1:屏幕截图收集
收集所有要分析的屏幕截图:
- 读取用户提供的屏幕截图文件
- 为每个屏幕截图,记录文件路径和提供的任何上下文
- 如果多个屏幕截图,判断它们是否来自同一产品
阶段2:并行分析
为每个屏幕截图并行启动三个任务代理:
代理1:screenshot-ui-analyzer
分析此屏幕截图的UI组件、布局结构和设计模式。
屏幕截图:[文件路径]
以JSON格式返回分析结果。
代理2:screenshot-interaction-analyzer
分析此屏幕截图的用户交互、导航流程和状态转换。
屏幕截图:[文件路径]
以JSON格式返回分析结果。
代理3:screenshot-business-analyzer
分析此屏幕截图的业务功能、数据实体和领域逻辑。
屏幕截图:[文件路径]
以JSON格式返回分析结果。
重要:在一个消息中使用Task工具进行三次并行调用以最大化效率。
阶段3:合成
在所有并行分析完成后,启动合成器代理:
代理4:screenshot-synthesizer
将这些分析结果合成为统一的开发任务清单。
UI分析:
[粘贴UI分析器结果]
交互分析:
[粘贴交互分析器结果]
业务分析:
[粘贴业务分析器结果]
产品名称:[产品名称]
输出文件:docs/plans/YYYY-MM-DD-<产品>-features.md
阶段4:审阅
启动审阅器代理以验证输出:
代理5:screenshot-reviewer
审阅此任务清单的完整性和质量。
原始屏幕截图:[文件路径]
任务清单:[合成输出]
如果发现问题,提供修正。
阶段5:输出
- 将最终任务清单写入
docs/plans/YYYY-MM-DD-<产品>-features.md - 使用references/output-format.md中的格式
- 向用户呈现摘要
关键指南
- 对所有任务使用
- [ ]复选框格式 - 将特征分解为小、可执行的子任务
- 关注用户交互,而不是实现细节
- 对于多个屏幕截图:在所有屏幕中重复去重特征
- 对于竞争分析:突出独特特征和差距
多代理方法的好处
- 全面性 - 三个专门视角捕捉更多细节
- 速度 - 并行分析减少总时间
- 质量 - 合成 + 审阅确保连贯、完整的输出
- 专业化 - 每个代理专注于其领域专业知识