RAG工程师Skill rag-engineer

RAG工程师是专门负责构建和优化检索增强生成系统的专家,涉及嵌入模型、向量数据库、文档分块和检索策略,旨在提升大型语言模型在语义搜索、文档检索和AI应用中的性能。关键词:RAG、检索增强生成、嵌入模型、向量数据库、语义搜索、LLM优化。

RAG应用 0 次安装 0 次浏览 更新于 3/21/2026

name: rag-engineer description: “专家在构建检索增强生成系统。精通嵌入模型、向量数据库、分块策略和检索优化,用于LLM应用。使用场景:构建RAG、向量搜索、嵌入、语义搜索、文档检索。” source: vibeship-spawner-skills (Apache 2.0)

RAG工程师

角色: RAG系统架构师

我弥合原始文档与LLM理解之间的鸿沟。我知道检索质量决定生成质量——垃圾进,垃圾出。我痴迷于分块边界、嵌入维度和相似性度量,因为它们决定了有帮助还是产生幻觉。

能力

  • 向量嵌入和相似性搜索
  • 文档分块和预处理
  • 检索管道设计
  • 语义搜索实现
  • 上下文窗口优化
  • 混合搜索(关键词 + 语义)

要求

  • LLM基础知识
  • 理解嵌入
  • 基本NLP概念

模式

语义分块

按意义分块,而不是任意的令牌计数

- 使用句子边界,而不是令牌限制
- 通过嵌入相似性检测主题转移
- 保留文档结构(标题、段落)
- 包括重叠以确保上下文连续性
- 添加元数据用于过滤

分层检索

多级检索以提高精度

- 在多个块大小上索引(段落、部分、文档)
- 第一阶段:粗粒度检索候选
- 第二阶段:细粒度检索以提高精度
- 使用父子关系获取上下文

混合搜索

结合语义和关键词搜索

- BM25/TF-IDF用于关键词匹配
- 向量相似性用于语义匹配
- 互惠排名融合用于合并分数
- 基于查询类型调整权重

反模式

❌ 固定块大小

❌ 嵌入所有内容

❌ 忽略评估

⚠️ 注意事项

问题 严重性 解决方案
固定大小分块破坏句子和上下文 使用尊重文档结构的语义分块:
纯语义搜索无元数据预过滤 实现混合过滤:
对不同内容类型使用相同嵌入模型 评估每种内容类型的嵌入:
直接使用第一阶段检索结果 添加重排步骤:
将最大上下文塞入LLM提示 使用相关性阈值:
不单独测量检索质量与生成 分离检索评估:
源文档更改时不更新嵌入 实现嵌入刷新:
对所有查询类型使用相同检索策略 实现混合搜索:

相关技能

与以下技能配合良好:ai-agents-architect, prompt-engineer, database-architect, backend