深度学习 Skill技能列表

4.5

PyTorchFSDP分布式训练技能Skill pytorch-fsdp

这个技能专为PyTorch FSDP(全分片数据并行训练)设计,提供参数分片、混合精度、CPU卸载和FSDP2等功能的详细指导,适用于大规模深度学习模型的分布式训练。关键词:PyTorch, FSDP, 分布式训练, 深度学习, 参数分片, 混合精度, CPU卸载, 人工智能, 机器学习。

4.5

TensorFlow神经网络构建与训练Skill tensorflow-neural-networks

这个技能专注于使用TensorFlow框架进行神经网络的构建和训练,覆盖从入门到高级的模型开发,包括图像分类、文本处理等应用。关键词:TensorFlow, 神经网络, 深度学习, Keras, 自定义层, 模型训练, AI开发, 机器学习, 计算机视觉, 自然语言处理。

4.5

Torchtitan分布式LLM预训练Skill distributed-llm-pretraining-torchtitan

Torchtitan是一个用于大规模语言模型(LLM)预训练的PyTorch原生平台,支持4D并行(FSDP2、TP、PP、CP)、Float8训练和分布式检查点,适用于从8到512+ GPU的Llama、DeepSeek等模型的预训练,提供高效的训练速度和可扩展性。关键词:分布式训练、LLM预训练、PyTorch、Torchtitan、4D并行、Float8、深度学习、人工智能。

4.5

MoE训练Skill moe-training

此技能专注于训练Mixture of Experts(专家混合)模型,适用于大规模深度学习模型的开发,如Mixtral 8x7B和DeepSeek-V3。它涵盖了MoE架构、路由机制、负载平衡和专家并行等技术,旨在以较低的计算成本训练高容量模型。关键词:MoE, 专家混合模型, 深度学习, 大模型训练, 稀疏架构, 计算优化。

4.5

等变架构设计师Skill equivariant-architecture-designer

这个技能用于设计尊重对称性群的神经网络架构,提供等变层、G-CNN、e3nn等技术的架构模式和实现指导,适用于图像处理、点云、图形等领域的深度学习任务。关键词:等变神经网络、对称性群、架构设计、深度学习、AI应用。

4.5

scvi-toolsSkill scvi-tools

scvi-tools 是一个用于单细胞分析的深度学习框架,提供多种模型如 scVI、scANVI、totalVI、PeakVI、MultiVI、DestVI、veloVI 和 sysVI,用于数据集成、批校正、多模态分析、参考映射、RNA 速度分析等。关键词:深度学习、单细胞分析、scvi-tools、数据集成、批校正、多模态分析、参考映射、RNA速度分析。

4.5

PyTorch图神经网络库(PyG)Skill torch-geometric

PyTorch Geometric (PyG) 是一个基于 PyTorch 的图神经网络库,用于开发和训练图神经网络,适用于节点分类、图分类、链接预测、分子性质预测、社交网络分析等应用。关键词:图神经网络,深度学习,PyTorch,GNN,节点分类,图分类,链接预测,分子预测,社交网络分析,异构图,几何深度学习,GCN,GAT,GraphSAGE。

4.5

DeepSpeed分布式训练技能Skill deepspeed

DeepSpeed技能提供对微软DeepSpeed框架的专家指导,专注于分布式深度学习训练优化,包括ZeRO技术、管道并行、混合精度训练和通信优化,适用于大规模模型训练、性能调优和内存效率提升。关键词:分布式训练、深度学习、ZeRO优化、混合精度、大规模模型训练、DeepSpeed框架、AI训练加速、GPU内存优化。

4.5

AlphaFold数据库技能Skill alphafold-database

这个技能用于访问AlphaFold AI预测的蛋白质结构数据库,支持通过UniProt ID检索结构、下载PDB/mmCIF文件、分析置信度指标如pLDDT和PAE,适用于药物发现、结构生物学、蛋白质工程和进化研究。关键词:AlphaFold,蛋白质结构预测,AI,深度学习,结构生物学,药物发现,生物信息学。

4.5

TensorFlow数据管道构建Skill tensorflow-data-pipelines

本技能专注于使用TensorFlow的tf.data API构建高效数据管道,用于优化深度学习训练性能。关键词包括TensorFlow、数据管道、tf.data、数据集创建、数据转换、批处理、打乱、预取、GPU/TPU优化、机器学习训练、数据增强、缓存策略。

4.5

nnsight远程神经网络解释工具Skill nnsight-remote-interpretability

nnsight是一个用于解释和操作神经网络内部的工具,支持通过NDIF远程执行,适用于大规模模型的可解释性实验。它允许研究人员在任何PyTorch模型上运行相同代码,无需本地GPU资源。关键词:神经网络解释,远程执行,nnsight,NDIF,大模型分析,PyTorch模型,深度学习可解释性。

4.5

HuggingFace加速器Skill huggingface-accelerate

HuggingFace Accelerate 是一个用于简化分布式训练的Python库,只需添加四行代码即可为PyTorch脚本提供分布式支持,支持DeepSpeed、FSDP等多种后端,自动处理设备放置和混合精度训练,是HuggingFace生态系统中的标准工具,适用于快速原型开发和统一API。关键词:分布式训练、PyTorch、HuggingFace、加速器、DeepSpeed、FSDP、混合精度、AI训练、深度学习。