检索增强生成(RAG)流水线 rag-pipeline

这是一个用于构建和部署检索增强生成(RAG)系统的技能。它详细说明了如何从文档中摄取数据、进行文本分块和向量化,并利用向量数据库(Qdrant)进行高效检索。该系统集成了提示工程和个性化设置,并通过智能体(Agent)类管理大语言模型调用,旨在为问答、知识库构建等场景提供准确、上下文相关的AI生成内容。关键词:RAG,检索增强生成,向量搜索,Qdrant,大语言模型,智能体,提示工程,知识库,AI应用。

RAG应用 0 次安装 0 次浏览 更新于 3/1/2026

名称: rag-pipeline 描述: 关于检索增强生成(RAG)流水线、数据摄取和向量搜索的详细信息。

RAG 流水线逻辑

数据摄取

  • 脚本: backend/ingest.py
  • 流程:
    1. 扫描 docs/ 目录。
    2. 清理 MDX 文件(移除 frontmatter 和 imports)。
    3. 分块文本(每块 1000 字符,重叠 100 字符)。
    4. 使用 models/text-embedding-004 模型进行嵌入。
    5. 将数据更新/插入到 Qdrant 集合 physical_ai_book 中。
  • 运行: python backend/ingest.py

向量搜索 (Qdrant)

  • 客户端: qdrant-client
  • 集合: physical_ai_book
  • 向量维度: 768 (Gecko-004)
  • 相似度算法: 余弦相似度

提示工程

  • 文件: backend/utils/helpers.py
  • RAG 提示: 构建包含检索到的上下文块的提示。
  • 个性化: backend/personalization.py 根据用户的 software_backgroundhardware_background 创建系统指令。

智能体流程

我们使用自定义的 Agent 类 (backend/agents.py) 来封装对大语言模型的调用,为未来扩展到多智能体工作流提供了可能。