name: rag-embedding-generation description: 支持缓存、速率限制和多提供商的大批量嵌入向量生成 allowed-tools:
- Read
- Write
- Edit
- Bash
- Glob
- Grep
RAG嵌入向量生成技能
能力
- 支持多种提供商生成嵌入向量
- 实现大数据集的批量处理
- 配置缓存以复用嵌入向量
- 处理速率限制和重试机制
- 支持多种嵌入模型
- 实现嵌入向量质量验证
目标流程
- rag-管道实施
- 向量数据库设置
实施细节
嵌入向量提供商
- OpenAI嵌入向量: text-embedding-ada-002, text-embedding-3-*
- HuggingFace: sentence-transformers模型
- Cohere: embed-v3模型
- Voyage AI: voyage-2模型
- 本地模型: GGUF/ONNX嵌入模型
配置选项
- 模型选择和参数设置
- 批量大小优化
- 缓存后端配置
- 速率限制设置
- 重试策略
- 维度设置
最佳实践
- 为特定领域选择合适的模型
- 实施缓存以降低成本
- 监控嵌入向量质量
- 优雅处理API错误
依赖项
- langchain-openai / langchain-huggingface
- numpy
- 缓存后端(Redis、SQLite)