RAG嵌入向量批量生成器Skill rag-embedding-generation

RAG嵌入向量批量生成技能是一个专门用于检索增强生成（RAG）系统中高效生成文本嵌入向量的工具。它支持OpenAI、HuggingFace、Cohere、Voyage AI等多种主流AI提供商和本地模型，具备批量处理、智能缓存、速率限制管理和自动重试等核心功能。该技能旨在优化RAG管道和向量数据库的构建过程，通过降低API调用成本、提升处理效率并确保嵌入质量，为AI应用开发、大模型微调和NLP项目提供关键技术支持。关键词：RAG嵌入生成，批量向量处理，AI模型缓存，多提供商支持，NLP嵌入优化，向量数据库，检索增强生成，LangChain集成。

RAG应用 0 次安装 27 次浏览更新于 2/23/2026

name: rag-embedding-generation description: 支持缓存、速率限制和多提供商的大批量嵌入向量生成 allowed-tools:

Read
Write
Edit
Bash
Glob
Grep

RAG嵌入向量生成技能

能力

支持多种提供商生成嵌入向量
实现大数据集的批量处理
配置缓存以复用嵌入向量
处理速率限制和重试机制
支持多种嵌入模型
实现嵌入向量质量验证

目标流程

rag-管道实施
向量数据库设置

实施细节

嵌入向量提供商

OpenAI嵌入向量: text-embedding-ada-002, text-embedding-3-*
HuggingFace: sentence-transformers模型
Cohere: embed-v3模型
Voyage AI: voyage-2模型
本地模型: GGUF/ONNX嵌入模型

配置选项

模型选择和参数设置
批量大小优化
缓存后端配置
速率限制设置
重试策略
维度设置

最佳实践

为特定领域选择合适的模型
实施缓存以降低成本
监控嵌入向量质量
优雅处理API错误

依赖项

langchain-openai / langchain-huggingface
numpy
缓存后端（Redis、SQLite）