人工智能 Skill技能列表

4.5

SGLang结构化生成框架Skill sglang

SGLang是一个高性能的大语言模型服务框架,专注于结构化生成和快速推理,通过RadixAttention技术实现自动前缀缓存,显著提升代理工作流、多轮对话等场景的效率。适用于AI智能体开发、JSON输出生成等应用。关键词:SGLang,结构化生成,RadixAttention,前缀缓存,LLM服务,AI智能体,高性能推理。

4.5

llama-cpp推理引擎Skill llama-cpp

llama-cpp是一个开源工具,用于在CPU、Apple Silicon和消费级GPU上高效运行大型语言模型推理,特别适用于边缘部署和没有NVIDIA硬件的环境。它支持GGUF量化格式,以减少内存使用并提高速度,优化用于苹果设备、AMD/Intel GPU和嵌入式系统。关键词包括:LLM推理、CPU推理、GGUF量化、边缘AI、非NVIDIA硬件、Apple Silicon、模型部署。

4.5

智能规划专家Skill gepetto

这是一个AI辅助的实现计划工具,通过多步骤流程(研究、访谈、规范合成、计划、外部审查、分节)创建详细的软件功能实现计划,适用于需要预分析的项目规划。关键词:AI规划、实现计划、多LLM审查、项目管理、软件开发。

4.5

GeminiCLI代码审查与分析技能Skill gemini

这个技能用于运行Gemini CLI工具,进行代码审查、计划审查和大上下文处理。它利用先进的AI模型(如Gemini 3 Pro)提供全面的分析能力,适用于软件开发、项目管理和数据处理任务。关键词:Gemini CLI, 代码审查, AI分析, 大模型处理, 自动化测试。

4.5

NeMo评估器SDKSkill nemo-evaluator-sdk

NeMo评估器SDK是一个用于评估大型语言模型(LLM)的企业级平台,支持100多个基准测试和多种后端执行方式(如Docker、Slurm HPC),提供可复现的容器化评估。适用于AI模型性能测试、比较和基准分析。关键词:LLM评估,AI基准测试,多后端执行,可复现评估,企业级平台,NeMo评估器。

4.5

代码生成模型评估Skill evaluating-code-models

此技能涉及使用BigCode评估工具对代码生成模型进行基准测试和性能评估,支持多语言代码生成质量分析,包括HumanEval、MBPP等基准测试,适用于AI模型开发、代码生成研究和SEO优化。关键词:代码生成模型评估、基准测试、多语言评估、pass@k指标、AI应用。

4.5

推测解码Skill speculative-decoding

这个技能用于加速大型语言模型(LLM)的推理过程,通过推测解码、Medusa多头和前瞻解码等技术,实现1.5到3.6倍的推理速度提升,降低延迟,适用于实时应用如聊天机器人、代码生成等。关键词包括:LLM推理加速、推测解码、Medusa、前瞻解码、并行生成、延迟优化、AI推理优化。

4.5

MoE训练Skill moe-training

此技能专注于训练Mixture of Experts(专家混合)模型,适用于大规模深度学习模型的开发,如Mixtral 8x7B和DeepSeek-V3。它涵盖了MoE架构、路由机制、负载平衡和专家并行等技术,旨在以较低的计算成本训练高容量模型。关键词:MoE, 专家混合模型, 深度学习, 大模型训练, 稀疏架构, 计算优化。

4.5

知识蒸馏Skill knowledge-distillation

知识蒸馏是一种压缩大型语言模型的技术,通过从大型教师模型向小型学生模型传递知识,以在部署时保持高性能并降低推理成本。适用于模型压缩、能力迁移、成本优化和专业模型创建等场景。关键词:知识蒸馏,模型压缩,LLM,教师-学生模型,温度缩放,软目标,反向KLD,大语言模型,人工智能,深度学习。

4.5

RayTrain分布式训练Skill ray-train

Ray Train 是一个分布式训练框架,用于在多节点集群上编排机器学习训练任务,支持PyTorch、TensorFlow和HuggingFace,内置超参数调优、容错和弹性扩展功能,适用于大规模模型训练和分布式超参数搜索。关键词:分布式训练,机器学习,PyTorch,TensorFlow,HuggingFace,超参数调优,容错,弹性扩展,多节点,Ray Tune。

4.5

PyTorchLightning深度学习训练框架Skill pytorch-lightning

PyTorch Lightning 是一个高级 PyTorch 框架,用于简化深度学习训练过程。它提供 Trainer 类来自动处理 GPU/TPU 切换、分布式训练(如 DDP、FSDP、DeepSpeed)、混合精度、梯度积累、检查点保存和日志记录,减少样板代码,使训练循环更干净、可扩展。适用于机器学习、深度学习项目,提高开发效率和代码可维护性,支持从研究到生产的环境。关键词:PyTorch Lightning, 深度学习, 训练框架, 分布式训练, 自动训练, PyTorch, 回调系统, 最佳实践。

4.5

PyTorchFSDP分布式训练技能Skill pytorch-fsdp

这个技能专为PyTorch FSDP(全分片数据并行训练)设计,提供参数分片、混合精度、CPU卸载和FSDP2等功能的详细指导,适用于大规模深度学习模型的分布式训练。关键词:PyTorch, FSDP, 分布式训练, 深度学习, 参数分片, 混合精度, CPU卸载, 人工智能, 机器学习。