搜索结果: "rag"
LLM评估技能Skill evaluating-llms
LLM评估技能用于评估大型语言模型系统,通过自动化指标、LLM作为裁判和基准测试,确保模型在生产环境中的质量和安全性。适用于测试提示质量、验证RAG管道、测量幻觉和偏见、比较模型性能。关键词:LLM评估、自动化指标、RAG验证、安全性测量、模型比较、生产部署。
向量嵌入优化Skill embedding-optimization
该技能用于优化向量嵌入的生成过程,通过模型选择、分块策略、缓存和性能调优,降低RAG系统和语义搜索的成本,提高检索质量。关键词包括:向量嵌入、RAG、语义搜索、成本优化、缓存、批量处理、性能监控。
AI数据工程Skill ai-data-engineering
AI数据工程技能专注于构建人工智能和机器学习系统的数据基础设施,特别用于检索增强生成(RAG)应用。它涵盖数据管道、特征存储、嵌入生成、工作流编排(如Dagster、Prefect)、数据版本化(LakeFS)和评估指标(如RAGAS)。适用于开发生产级AI应用,如语义搜索、实时特征服务和RAG系统,提供架构模式和实践指南。关键词:AI数据工程、RAG管道、特征存储、嵌入生成、Dagster、RAGAS、机器学习基础设施。