名称: rag-design 描述: 为特定用例设计RAG架构 参数提示: <use-case> 允许工具: Read, Glob, Grep, Skill, Task
设计RAG架构
为给定的用例设计检索增强生成系统。
参数
$ARGUMENTS - 要设计的RAG用例(例如,“客户支持聊天机器人”、“文档问答”、“法律文档搜索”、“代码助手”)
工作流程
-
澄清需求 通过理解:
- 会提出什么类型的问题?
- 文档语料库的大小和类型是什么?
- 所需的准确性/忠实度是什么?
- 延迟预算是多少?
- 是否有多轮对话需求?
-
根据用例加载相关技能:
- RAG模式 →
rag-architecture - 向量存储选择 →
vector-databases - LLM服务 →
llm-serving-patterns - 推理优化 →
ml-inference-optimization
- RAG模式 →
-
生成rag-architect代理 进行综合设计:
- 使用Task工具,设置subagent_type=“rag-architect”
- 提供完整的用例上下文和需求
- 请求端到端的RAG架构
-
设计摄取管道:
- 文档提取(PDF、HTML、代码)
- 分块策略选择
- 嵌入模型选择
- 向量数据库配置
- 元数据提取和索引
-
设计检索管道:
- 查询处理(扩展、HyDE)
- 检索策略(密集、稀疏、混合)
- 重新排序方法
- 上下文组装
- 提示工程
-
处理质量和扩展:
- 检索准确性(recall@k、MRR)
- 答案忠实度(基础)
- 延迟预算分配
- 成本优化
- 扩展策略
示例用法
/sd:rag-design 拥有10K FAQ文档的客户支持聊天机器人
/sd:rag-design 工程团队的内部文档问答
/sd:rag-design 合同审查的法律文档搜索
/sd:rag-design 企业代码库的代码助手
/sd:rag-design 拥有100K论文的研究论文问答
/sd:rag-design 结构化数据的产品目录搜索
/sd:rag-design 多语言知识库
用例类别
| 类别 | 关键考虑因素 |
|---|---|
| 客户支持 | FAQ覆盖率、升级、语调一致性 |
| 文档 | 技术准确性、代码示例、版本控制 |
| 法律/合规 | 引文准确性、审计追踪、访问控制 |
| 代码助手 | AST-aware分块、上下文相关性、IDE集成 |
| 研究/学术 | 多文档推理、引文、长篇答案 |
| 电子商务 | 产品属性、库存意识、个性化 |
RAG模式选择指南
| 复杂度 | 模式 | 何时使用 |
|---|---|---|
| 低 | 基础RAG | 简单Q&A、小型语料库 |
| 中 | RAG + 重新排序 | 需要更高准确性 |
| 中 | 混合搜索 | 混合关键词 + 语义查询 |
| 高 | 查询转换 | 模糊或复杂查询 |
| 高 | 代理RAG | 多跳推理、工具使用 |
输出
一个全面的RAG系统架构包括:
- 摄取管道(文档 → 向量)
- 检索管道(查询 → 上下文)
- 技术栈(嵌入模型、向量DB、LLM)
- 质量目标(召回率、忠实度、延迟)
- 权衡和替代方案
- 成本估算(每查询和每月)