大模型微调 Skill技能列表

4.5

miles强化学习训练框架Skill miles-rl-training

miles是一个企业级强化学习框架,专注于训练大型混合专家模型,支持FP8和INT4量化训练,确保训练与推理的精确对齐,并通过推测性RL优化性能,适合生产环境使用。关键词: 强化学习, MoE模型, FP8训练, INT4量化, 训练-推理对齐, 推测性RL, 企业级AI框架。

4.5

知识蒸馏Skill knowledge-distillation

知识蒸馏是一种压缩大型语言模型的技术,通过从大型教师模型向小型学生模型传递知识,以在部署时保持高性能并降低推理成本。适用于模型压缩、能力迁移、成本优化和专业模型创建等场景。关键词:知识蒸馏,模型压缩,LLM,教师-学生模型,温度缩放,软目标,反向KLD,大语言模型,人工智能,深度学习。

4.5

AI大模型迁移技能Skill claude-opus-4-5-migration

这个技能用于帮助开发者和AI工程师将Claude AI模型从旧版本(如Sonnet或Opus)迁移到Opus 4.5,包括更新模型字符串、调整提示以处理行为差异,并优化代码库和API调用。关键词:AI模型迁移,Claude,Opus 4.5,代码更新,提示工程,大模型升级,AI工具调整。

4.5

Opus4.5MigrationGuideSkill claude-opus-4-5-migration

这是一个用于将代码库从Sonnet 4.0、Sonnet 4.5或Opus 4.1迁移到Opus 4.5的指南,包括模型字符串更新、代码调整和行为差异处理。

4.5

AWQ量化技术Skill awq-quantization

AWQ(激活感知权重量化)是一种先进的4位量化技术,专为大型语言模型(LLM)设计,通过分析激活模式来保护关键权重,实现高达3倍的推理加速,同时保持最小精度损失。适用于AI模型部署、大模型微调、生产推理加速等场景,关键词包括AWQ、量化、LLM压缩、推理优化、AI部署。

4.5

LitGPT模型实现与微调技能Skill implementing-llms-litgpt

这个技能专注于使用 Lightning AI 的 LitGPT 工具来实现和训练大型语言模型(LLM),支持 20 多种预训练架构(如 Llama、Gemma、Phi 等)。适用于教育目的、生产级微调(使用 LoRA/QLoRA)、单文件实现等场景。关键词包括:LitGPT、LLM、微调、LoRA、QLoRA、模型训练、Lightning AI。

4.5

RWKV架构Skill rwkv-architecture

RWKV是一种结合Transformer和RNN的混合神经网络架构,具有线性推理复杂度、无限上下文处理能力和高效内存使用。适用于长序列处理、流式应用和大模型训练与推理,特别适合AI领域的模型开发和优化。关键词:RWKV, Transformer, RNN, 线性复杂度, 无限上下文, 高效推理, 机器学习, AI模型, 大模型微调