人工智能 Skill技能列表
提示库技能Skill prompt-library
这是一个高质量提示模板库,用于优化AI模型的使用,包含角色扮演、任务特定模板和提示改进技术,适用于编码、写作、分析或创意任务。关键词包括:提示模板、AI提示、角色扮演、代码审查、技术写作、数据分析、SEO优化。
提示工程Skill prompt-engineering
提示工程是一种专注于设计和优化与大语言模型(LLM)交互的提示的技术,用于提高模型的性能、准确性和可靠性。它广泛应用于AI应用中,如内容生成、代码审查和问题解决。关键词:提示工程,LLM优化,AI提示设计,大模型应用。
OutlinesSkill outlines
Outlines是一个Python库,专门用于结构化文本生成,确保输出符合JSON、XML或代码结构。它集成Pydantic模型提供类型安全,支持本地AI模型如Transformers和vLLM,并通过有限状态机优化推理速度,适用于数据提取、分类和代码生成等场景。关键词:结构化文本生成、JSON生成、Pydantic、本地模型、推理优化、NLP、人工智能应用。
结构化LLM输出提取库Skill instructor
Instructor是一个Python库,用于从大型语言模型(LLM)响应中可靠提取结构化数据,自动验证输出,支持重试失败提取和流式处理部分结果,适用于数据提取、分类、结构化分析等AI应用场景。关键词:LLM,结构化输出,数据提取,Pydantic验证,自动重试,流式处理,AI工具。
Guidance约束生成框架Skill guidance
Guidance 是 Microsoft Research 开发的框架,用于约束大语言模型的输出生成。它支持通过正则表达式和上下文无关语法控制输出格式,确保生成的内容如 JSON、XML 等符合指定结构,并可用于构建复杂的多步骤工作流程。关键词:Guidance, LLM, 约束生成, JSON 生成, 正则表达式, 语法, 微软研究, AIGC
DSPy框架:声明性语言模型编程Skill dspy
DSPy是一个来自Stanford NLP的框架,用于通过声明性编程构建和优化语言模型系统,支持自动提示优化、模块化RAG(检索增强生成)应用和AI代理开发,适用于自然语言处理任务。关键词:DSPy, 声明性编程, 提示优化, RAG, AI系统, 语言模型, Stanford NLP
提示工程师Skill prompt-engineer
这个技能专注于为大语言模型应用设计和优化提示,提升AI应用效果,涉及系统提示架构、上下文管理、输出格式化、提示评估等。关键词:提示工程、LLM、AI应用、优化、设计、大模型、提示结构。
提示缓存Skill prompt-caching
这个技能专注于大型语言模型(LLM)的提示缓存策略,通过多级缓存(包括提示前缀、完整响应和语义相似性匹配)来优化成本和性能。它包括Anthropic提示缓存、响应缓存和缓存增强生成(CAG)等技术,适用于减少LLM推理延迟、降低成本,并提高系统的响应效率。关键词:LLM提示缓存、成本优化、语义缓存、CAG、响应缓存、缓存失效、AI应用。
verl强化学习训练技能Skill verl-rl-training
这个技能提供了使用verl库进行大型语言模型强化学习训练的全面指导,包括RLHF、GRPO、PPO等多种算法,支持分布式训练、多后端切换,适用于数学推理、视觉语言模型等场景。关键词:verl, 强化学习, LLM, RLHF, GRPO, PPO, 分布式训练, 大模型微调。
TRL强化学习Skill fine-tuning-with-trl
TRL(Transformer 强化学习)是一个用于通过强化学习对齐语言模型与人类偏好的技能,包括监督微调(SFT)、直接偏好优化(DPO)、PPO和GRPO等方法,适用于RLHF流程、偏好对齐和奖励模型训练。关键词:TRL, 强化学习, 语言模型, 微调, RLHF, DPO, PPO, 人工智能, 大模型, HuggingFace, 偏好学习。
torchforge强化学习训练Skill torchforge-rl-training
torchforge是Meta的PyTorch原生强化学习库,专为算法与基础设施分离设计,支持GRPO、SFT等训练方法,适用于数学推理、自定义损失函数和多GPU分布式训练。关键词:torchforge, 强化学习, PyTorch, GRPO, 分布式训练, AI应用, 算法实验
Slime大模型强化学习微调框架Skill slime-rl-training
Slime 是一个专为大语言模型(LLM)设计的后训练强化学习框架,结合 Megatron-LM 进行高效训练和 SGLang 进行高吞吐量推理生成。它支持 GLM、Qwen3、DeepSeek 等多种模型,适用于自定义数据生成、多轮对话训练和智能体开发,关键词包括:大语言模型、强化学习、后训练、Megatron-LM、SGLang、微调、AI 智能体。