检索增强生成(RAG)流水线Skill rag-pipeline

这是一个用于构建和部署检索增强生成（RAG）系统的技能。它详细说明了如何从文档中摄取数据、进行文本分块和向量化，并利用向量数据库（Qdrant）进行高效检索。该系统集成了提示工程和个性化设置，并通过智能体（Agent）类管理大语言模型调用，旨在为问答、知识库构建等场景提供准确、上下文相关的AI生成内容。关键词：RAG，检索增强生成，向量搜索，Qdrant，大语言模型，智能体，提示工程，知识库，AI应用。

RAG应用 0 次安装 8 次浏览更新于 3/1/2026

名称: rag-pipeline 描述: 关于检索增强生成（RAG）流水线、数据摄取和向量搜索的详细信息。

RAG 流水线逻辑

数据摄取

脚本: backend/ingest.py
流程:
1. 扫描 docs/ 目录。
2. 清理 MDX 文件（移除 frontmatter 和 imports）。
3. 分块文本（每块 1000 字符，重叠 100 字符）。
4. 使用 models/text-embedding-004 模型进行嵌入。
5. 将数据更新/插入到 Qdrant 集合 physical_ai_book 中。
运行: python backend/ingest.py

向量搜索 (Qdrant)

客户端: qdrant-client
集合: physical_ai_book
向量维度: 768 (Gecko-004)
相似度算法: 余弦相似度

提示工程

文件: backend/utils/helpers.py。
RAG 提示: 构建包含检索到的上下文块的提示。
个性化: backend/personalization.py 根据用户的 software_background 和 hardware_background 创建系统指令。

智能体流程

我们使用自定义的 Agent 类 (backend/agents.py) 来封装对大语言模型的调用，为未来扩展到多智能体工作流提供了可能。