名称: ml-pipeline 描述: 为问题设计机器学习系统 参数提示: <问题> 允许的工具: Read, Glob, Grep, Skill, Task
设计机器学习管道
为给定问题设计端到端机器学习系统架构。
参数
$ARGUMENTS - 要设计的机器学习问题(例如,“推荐系统”、“欺诈检测”、“搜索排名”、“内容审核”)
工作流程
-
澄清需求 通过理解:
- 正在做出什么预测?
- 延迟要求是什么?(实时 vs 批处理)
- 规模如何?(QPS、数据量)
- 预测的消费者是谁?
-
加载相关技能 基于问题:
- 核心ML架构 →
ml-system-design - 基于LLM的系统 →
llm-serving-patterns - RAG系统 →
rag-architecture - 推理优化 →
ml-inference-optimization - 向量搜索 →
vector-databases
- 核心ML架构 →
-
生成 ml-systems-designer 代理 进行全面设计:
- 使用 Task 工具,subagent_type=“ml-systems-designer”
- 提供完整的问题上下文和需求
- 请求端到端架构
-
设计完整管道:
- 数据摄入和处理
- 特征工程和特征存储
- 模型训练基础设施
- 模型服务和推理
- 监控和可观测性
- A/B测试和实验
-
处理跨领域关注点:
- 训练-服务偏移预防
- 特征一致性
- 模型版本控制和回滚
- 成本优化
示例用法
/sd:ml-pipeline recommendation system for 100M users
/sd:ml-pipeline real-time fraud detection for payments
/sd:ml-pipeline search ranking for e-commerce with 10M products
/sd:ml-pipeline content moderation for social media
/sd:ml-pipeline ad click prediction at 1M QPS
/sd:ml-pipeline customer churn prediction
/sd:ml-pipeline demand forecasting for inventory
问题类别
| 类别 | 关键考虑因素 |
|---|---|
| 推荐系统 | 冷启动、实时信号、A/B测试 |
| 欺诈/风险 | 低延迟(<100ms)、规则+ML混合、反馈循环 |
| 搜索/排名 | 多阶段排名、个性化、位置偏差 |
| NLP/LLM | 推理成本、缓存、流式响应 |
| 计算机视觉 | GPU推理、批处理、边缘部署 |
| 时间序列 | 特征新鲜度、窗口化、季节性模式 |
输出
全面的机器学习系统架构,包括:
- 高级架构图(基于组件)
- 从源到预测的数据流
- 技术栈推荐
- 考虑的权衡和替代方案
- 分阶段实施方法
- 成本和规模考虑