搜索结果: "rag"

4.5

向量嵌入优化Skill embedding-optimization

该技能用于优化向量嵌入的生成过程,通过模型选择、分块策略、缓存和性能调优,降低RAG系统和语义搜索的成本,提高检索质量。关键词包括:向量嵌入、RAG、语义搜索、成本优化、缓存、批量处理、性能监控。

4.5

RAG查询转换技能Skill rag-query-transformation

RAG查询转换技能是一个专注于提升检索增强生成(RAG)系统检索效果的工具集。它通过查询扩展、假设文档嵌入(HyDE)、多查询生成、查询分解和逐步回溯提示等核心技术,对用户原始查询进行智能转换和优化,从而从知识库中检索出更相关、更全面的信息片段,为大模型生成高质量答案奠定基础。 关键词:RAG查询转换,检索增强生成,查询扩展,HyDE假设文档嵌入,多查询生成,查询分解,逐步回溯提示,AI问答优化,知识库检索,大模型应用

4.5

agentuity-cli-cloud-storage-deleteSkill agentuity-cli-cloud-storage-delete

这是一个用于Agentuity云平台的命令行工具技能,用于安全删除云存储资源(如存储桶)或文件。该技能需要用户身份验证和组织上下文,支持交互式选择、模拟运行和跳过确认提示。关键词:Agentuity云平台、云存储删除、命令行工具、存储桶管理、文件删除、DevOps工具。

4.5

agentuity-cli-cloud-storage-createSkill agentuity-cli-cloud-storage-create

Agentuity云存储创建工具,用于在Agentuity云平台上快速创建和管理存储资源。关键词:云存储,存储桶创建,Agentuity CLI,云平台操作,DevOps工具,命令行工具,云资源管理。

4.5

构建RAG系统Skill building-rag-systems

本技能详细介绍了如何构建生产级的检索增强生成(RAG)系统,涵盖从文档摄取到智能检索的全流程。核心内容包括:语义分块策略(基于标题分割,避免固定大小)、增量索引与变更检测(通过文件哈希实现高效更新)、批处理向量嵌入(使用OpenAI API)、以及基于Qdrant向量数据库的过滤检索和上下文扩展。适用于需要构建企业级知识库、智能问答系统或文档智能检索应用的开发者,关键词包括:RAG系统、语义分块、增量索引、向量检索、Qdrant、OpenAI嵌入、生产级部署。

4.5

Agentuity云存储上传工具Skill agentuity-cli-cloud-storage-upload

Agentuity云存储上传工具是一个命令行接口技能,专门用于将本地文件或标准输入流上传到指定的云存储桶中。该工具支持身份验证、自定义对象键、内容类型设置和管道操作,适用于云平台文件管理、数据备份和自动化部署等场景。关键词:云存储上传、Agentuity CLI、文件管理、云平台操作、存储桶、命令行工具、DevOps自动化。

4.5

学习关闭Skill learn-off

该技能用于关闭AI智能体的持续学习模式,停止自动从对话中提取和积累知识。关键词:AI智能体,持续学习,知识管理,模式切换,RAG应用,机器学习。

4.5

LangChain架构Skill langchain-architecture

LangChain框架用于开发和设计基于大语言模型的应用程序,集成代理、链、记忆和工具,适用于AI智能体构建、多步工作流管理、文档处理、RAG应用等场景,提升LLM应用开发效率,关键词包括LangChain、AI代理、大模型应用、RAG、LLM工作流、记忆管理。

4.5

检索-搜索-编排Skill retrieval-search-orchestration

该技能用于设计RAG系统中知识图谱的检索策略,包括检索模式选择、查询分解、排名配置和来源跟踪,以提高信息检索的准确性和可追溯性。关键词:检索策略、知识图谱、RAG、查询分解、来源跟踪、检索增强生成。

4.5

向量数据库应用技能Skill using-vector-databases

这个技能专注于使用向量数据库来实现人工智能和机器学习应用,包括语义搜索、检索增强生成(RAG)系统、推荐系统等。关键技术涵盖向量数据库选择(如Qdrant、Pinecone)、嵌入模型(如OpenAI、Voyage AI)、文档分块策略和混合搜索模式。适用于构建聊天机器人、搜索引擎、知识库问答等AI驱动的应用,关键词包括:向量数据库、AI、ML、语义搜索、RAG、嵌入生成、分块、混合搜索、Qdrant、Pinecone。

4.5

模型服务Skill model-serving

模型服务技能专注于部署和优化大型语言模型(LLM)及机器学习(ML)模型进行生产推理。它涉及使用vLLM、TensorRT-LLM、BentoML等工具构建AI API、实现流式响应、集成RAG管道和性能优化,适用于自托管部署、GPU加速和前端集成。关键词:模型服务,LLM部署,AI推理,vLLM,TensorRT-LLM,BentoML,RAG,流式响应,性能优化。

4.5

RAG重排序与多样性过滤Skill rag-reranking

RAG重排序技能专注于提升检索增强生成(RAG)系统的检索质量。它通过交叉编码器重排序、Cohere Rerank API、最大边际相关性(MMR)多样性过滤以及LLM评分等多种技术,对初步检索结果进行二次排序和筛选。该技能旨在优化RAG流程,确保返回给大语言模型的上下文信息既高度相关又具备多样性,从而显著提升最终生成答案的准确性和丰富性。关键词:RAG重排序,交叉编码器,MMR多样性过滤,Cohere Rerank,检索增强生成,多阶段检索,相关性排序,AI检索优化。