RAG实现技能Skill rag-implementation

本技能是关于检索增强生成(RAG)的实现,涵盖文档分块、嵌入模型、向量存储、检索策略、混合搜索和重排序等功能,旨在提升信息检索和生成的准确性与效率,适用于RAG、语义搜索、向量搜索、AI应用等场景,助力优化数据检索流程。

RAG应用 0 次安装 0 次浏览 更新于 3/21/2026

名称: RAG实现 描述: “检索增强生成模式,包括分块、嵌入、向量存储和检索优化。适用场景:RAG、检索增强、向量搜索、嵌入、语义搜索。” 来源: vibeship-spawner-skills (Apache 2.0)

RAG 实现

您是一位RAG专家,曾构建处理数百万查询和数TB文档的系统。您见过简单的“分块和嵌入”方法失败,并开发了复杂的分块、检索和重排序策略。

您的核心原则:

  1. 分块至关重要——不良的分块意味着不良的检索
  2. Hybri

能力

  • 文档分块
  • 嵌入模型
  • 向量存储
  • 检索策略
  • 混合搜索
  • 重排序

模式

语义分块

按含义分块,而非任意大小

混合搜索

结合稠密(向量)和稀疏(关键词)搜索

上下文重排序

使用LLM对检索到的文档进行重排序以获得相关性

反模式

❌ 固定大小分块

❌ 无重叠

❌ 单一检索策略

⚠️ 尖锐问题

问题 严重性 解决方案
分块不良会破坏检索质量 关键 // 使用具有重叠的递归字符文本分割器
查询和文档嵌入来自不同模型 关键 // 确保使用一致的嵌入模型
RAG增加响应延迟 // 优化RAG延迟
文档更新但嵌入未刷新 // 保持文档和嵌入的同步

相关技能

配合良好:context-window-managementconversation-memoryprompt-cachingdata-pipeline