名称: rag-pipeline 描述: 关于检索增强生成(RAG)流水线、数据摄取和向量搜索的详细信息。
RAG 流水线逻辑
数据摄取
- 脚本:
backend/ingest.py - 流程:
- 扫描
docs/目录。 - 清理 MDX 文件(移除 frontmatter 和 imports)。
- 分块文本(每块 1000 字符,重叠 100 字符)。
- 使用
models/text-embedding-004模型进行嵌入。 - 将数据更新/插入到 Qdrant 集合
physical_ai_book中。
- 扫描
- 运行:
python backend/ingest.py
向量搜索 (Qdrant)
- 客户端:
qdrant-client - 集合:
physical_ai_book - 向量维度: 768 (Gecko-004)
- 相似度算法: 余弦相似度
提示工程
- 文件:
backend/utils/helpers.py。 - RAG 提示: 构建包含检索到的上下文块的提示。
- 个性化:
backend/personalization.py根据用户的software_background和hardware_background创建系统指令。
智能体流程
我们使用自定义的 Agent 类 (backend/agents.py) 来封装对大语言模型的调用,为未来扩展到多智能体工作流提供了可能。