RAG架构设计技能Skill rag-design

这个技能用于设计检索增强生成(RAG)系统架构,针对特定用例如客户支持聊天机器人、文档问答、法律文档搜索等。它包括需求澄清、技能加载、代理生成、摄取和检索管道设计,以及质量和扩展优化。适用于AI驱动应用开发,提高信息检索和生成准确性。关键词:RAG架构、检索增强生成、AI设计、文档处理、向量数据库、LLM集成、智能系统开发。

RAG应用 0 次安装 0 次浏览 更新于 3/11/2026

名称: rag-design 描述: 为特定用例设计RAG架构 参数提示: <use-case> 允许工具: Read, Glob, Grep, Skill, Task

设计RAG架构

为给定的用例设计检索增强生成系统。

参数

$ARGUMENTS - 要设计的RAG用例(例如,“客户支持聊天机器人”、“文档问答”、“法律文档搜索”、“代码助手”)

工作流程

  1. 澄清需求 通过理解:

    • 会提出什么类型的问题?
    • 文档语料库的大小和类型是什么?
    • 所需的准确性/忠实度是什么?
    • 延迟预算是多少?
    • 是否有多轮对话需求?
  2. 根据用例加载相关技能

    • RAG模式 → rag-architecture
    • 向量存储选择 → vector-databases
    • LLM服务 → llm-serving-patterns
    • 推理优化 → ml-inference-optimization
  3. 生成rag-architect代理 进行综合设计:

    • 使用Task工具,设置subagent_type=“rag-architect”
    • 提供完整的用例上下文和需求
    • 请求端到端的RAG架构
  4. 设计摄取管道

    • 文档提取(PDF、HTML、代码)
    • 分块策略选择
    • 嵌入模型选择
    • 向量数据库配置
    • 元数据提取和索引
  5. 设计检索管道

    • 查询处理(扩展、HyDE)
    • 检索策略(密集、稀疏、混合)
    • 重新排序方法
    • 上下文组装
    • 提示工程
  6. 处理质量和扩展

    • 检索准确性(recall@k、MRR)
    • 答案忠实度(基础)
    • 延迟预算分配
    • 成本优化
    • 扩展策略

示例用法

/sd:rag-design 拥有10K FAQ文档的客户支持聊天机器人
/sd:rag-design 工程团队的内部文档问答
/sd:rag-design 合同审查的法律文档搜索
/sd:rag-design 企业代码库的代码助手
/sd:rag-design 拥有100K论文的研究论文问答
/sd:rag-design 结构化数据的产品目录搜索
/sd:rag-design 多语言知识库

用例类别

类别 关键考虑因素
客户支持 FAQ覆盖率、升级、语调一致性
文档 技术准确性、代码示例、版本控制
法律/合规 引文准确性、审计追踪、访问控制
代码助手 AST-aware分块、上下文相关性、IDE集成
研究/学术 多文档推理、引文、长篇答案
电子商务 产品属性、库存意识、个性化

RAG模式选择指南

复杂度 模式 何时使用
基础RAG 简单Q&A、小型语料库
RAG + 重新排序 需要更高准确性
混合搜索 混合关键词 + 语义查询
查询转换 模糊或复杂查询
代理RAG 多跳推理、工具使用

输出

一个全面的RAG系统架构包括:

  • 摄取管道(文档 → 向量)
  • 检索管道(查询 → 上下文)
  • 技术栈(嵌入模型、向量DB、LLM)
  • 质量目标(召回率、忠实度、延迟)
  • 权衡和替代方案
  • 成本估算(每查询和每月)