RAG嵌入向量批量生成器Skill rag-embedding-generation

RAG嵌入向量批量生成技能是一个专门用于检索增强生成(RAG)系统中高效生成文本嵌入向量的工具。它支持OpenAI、HuggingFace、Cohere、Voyage AI等多种主流AI提供商和本地模型,具备批量处理、智能缓存、速率限制管理和自动重试等核心功能。该技能旨在优化RAG管道和向量数据库的构建过程,通过降低API调用成本、提升处理效率并确保嵌入质量,为AI应用开发、大模型微调和NLP项目提供关键技术支持。关键词:RAG嵌入生成,批量向量处理,AI模型缓存,多提供商支持,NLP嵌入优化,向量数据库,检索增强生成,LangChain集成。

RAG应用 0 次安装 4 次浏览 更新于 2/23/2026

name: rag-embedding-generation description: 支持缓存、速率限制和多提供商的大批量嵌入向量生成 allowed-tools:

  • Read
  • Write
  • Edit
  • Bash
  • Glob
  • Grep

RAG嵌入向量生成技能

能力

  • 支持多种提供商生成嵌入向量
  • 实现大数据集的批量处理
  • 配置缓存以复用嵌入向量
  • 处理速率限制和重试机制
  • 支持多种嵌入模型
  • 实现嵌入向量质量验证

目标流程

  • rag-管道实施
  • 向量数据库设置

实施细节

嵌入向量提供商

  1. OpenAI嵌入向量: text-embedding-ada-002, text-embedding-3-*
  2. HuggingFace: sentence-transformers模型
  3. Cohere: embed-v3模型
  4. Voyage AI: voyage-2模型
  5. 本地模型: GGUF/ONNX嵌入模型

配置选项

  • 模型选择和参数设置
  • 批量大小优化
  • 缓存后端配置
  • 速率限制设置
  • 重试策略
  • 维度设置

最佳实践

  • 为特定领域选择合适的模型
  • 实施缓存以降低成本
  • 监控嵌入向量质量
  • 优雅处理API错误

依赖项

  • langchain-openai / langchain-huggingface
  • numpy
  • 缓存后端(Redis、SQLite)