Name: RAG架构设计技能Skill
Rating: 5 (6 reviews)
Author: melodic

名称: rag-design 描述: 为特定用例设计RAG架构参数提示: <use-case> 允许工具: Read, Glob, Grep, Skill, Task

设计RAG架构

为给定的用例设计检索增强生成系统。

参数

$ARGUMENTS - 要设计的RAG用例（例如，“客户支持聊天机器人”、“文档问答”、“法律文档搜索”、“代码助手”）

工作流程

澄清需求 通过理解：
- 会提出什么类型的问题？
- 文档语料库的大小和类型是什么？
- 所需的准确性/忠实度是什么？
- 延迟预算是多少？
- 是否有多轮对话需求？
根据用例加载相关技能：
- RAG模式 → rag-architecture
- 向量存储选择 → vector-databases
- LLM服务 → llm-serving-patterns
- 推理优化 → ml-inference-optimization
生成rag-architect代理 进行综合设计：
- 使用Task工具，设置subagent_type=“rag-architect”
- 提供完整的用例上下文和需求
- 请求端到端的RAG架构
设计摄取管道：
- 文档提取（PDF、HTML、代码）
- 分块策略选择
- 嵌入模型选择
- 向量数据库配置
- 元数据提取和索引
设计检索管道：
- 查询处理（扩展、HyDE）
- 检索策略（密集、稀疏、混合）
- 重新排序方法
- 上下文组装
- 提示工程
处理质量和扩展：
- 检索准确性（recall@k、MRR）
- 答案忠实度（基础）
- 延迟预算分配
- 成本优化
- 扩展策略

示例用法

/sd:rag-design 拥有10K FAQ文档的客户支持聊天机器人
/sd:rag-design 工程团队的内部文档问答
/sd:rag-design 合同审查的法律文档搜索
/sd:rag-design 企业代码库的代码助手
/sd:rag-design 拥有100K论文的研究论文问答
/sd:rag-design 结构化数据的产品目录搜索
/sd:rag-design 多语言知识库

用例类别

类别	关键考虑因素
客户支持	FAQ覆盖率、升级、语调一致性
文档	技术准确性、代码示例、版本控制
法律/合规	引文准确性、审计追踪、访问控制
代码助手	AST-aware分块、上下文相关性、IDE集成
研究/学术	多文档推理、引文、长篇答案
电子商务	产品属性、库存意识、个性化

RAG模式选择指南

复杂度	模式	何时使用
低	基础RAG	简单Q&A、小型语料库
中	RAG + 重新排序	需要更高准确性
中	混合搜索	混合关键词 + 语义查询
高	查询转换	模糊或复杂查询
高	代理RAG	多跳推理、工具使用

输出

一个全面的RAG系统架构包括：

摄取管道（文档 → 向量）
检索管道（查询 → 上下文）
技术栈（嵌入模型、向量DB、LLM）
质量目标（召回率、忠实度、延迟）
权衡和替代方案
成本估算（每查询和每月）

名称: rag-design 描述: 为特定用例设计RAG架构 参数提示: <use-case> 允许工具: Read, Glob, Grep, Skill, Task

设计RAG架构

参数

工作流程

示例用法

用例类别

RAG模式选择指南

输出

名称: rag-design 描述: 为特定用例设计RAG架构参数提示: <use-case> 允许工具: Read, Glob, Grep, Skill, Task