LLM评估技能用于评估大型语言模型系统,通过自动化指标、LLM作为裁判和基准测试,确保模型在生产环境中的质量和安全性。适用于测试提示质量、验证RAG管道、测量幻觉和偏见、比较模型性能。关键词:LLM评估、自动化指标、RAG验证、安全性测量、模型比较、生产部署。
该技能用于优化向量嵌入的生成过程,通过模型选择、分块策略、缓存和性能调优,降低RAG系统和语义搜索的成本,提高检索质量。关键词包括:向量嵌入、RAG、语义搜索、成本优化、缓存、批量处理、性能监控。