大模型微调 - SkillsBot AI Skill技能库

热门搜索：openclaw springboot vue react 短视频智能体 rag 爬虫量化区块链比特币

大模型微调 Skill技能列表

GPTQ量化Skill gptq

GPTQ是一种后训练量化技术，用于大型语言模型，通过4位量化实现4倍内存减少和3-4倍推理加速，精度损失低于2%。它易于与Hugging Face Transformers和PEFT集成，支持QLoRA微调，适用于在有限GPU资源上部署大模型。关键词：量化，大型语言模型，内存优化，推理加速，4位量化，GPTQ，大模型部署，AI优化。

安装

⚡

4.5

LitGPT模型实现与微调技能Skill implementing-llms-litgpt

这个技能专注于使用 Lightning AI 的 LitGPT 工具来实现和训练大型语言模型（LLM），支持 20 多种预训练架构（如 Llama、Gemma、Phi 等）。适用于教育目的、生产级微调（使用 LoRA/QLoRA）、单文件实现等场景。关键词包括：LitGPT、LLM、微调、LoRA、QLoRA、模型训练、Lightning AI。

安装

⚡

4.5

TRL强化学习Skill fine-tuning-with-trl

TRL（Transformer 强化学习）是一个用于通过强化学习对齐语言模型与人类偏好的技能，包括监督微调（SFT）、直接偏好优化（DPO）、PPO和GRPO等方法，适用于RLHF流程、偏好对齐和奖励模型训练。关键词：TRL, 强化学习, 语言模型, 微调, RLHF, DPO, PPO, 人工智能, 大模型, HuggingFace, 偏好学习。

安装

⚡

4.5