深度学习 Skill技能列表
HuggingFace加速器Skill huggingface-accelerate
HuggingFace Accelerate 是一个用于简化分布式训练的Python库,只需添加四行代码即可为PyTorch脚本提供分布式支持,支持DeepSpeed、FSDP等多种后端,自动处理设备放置和混合精度训练,是HuggingFace生态系统中的标准工具,适用于快速原型开发和统一API。关键词:分布式训练、PyTorch、HuggingFace、加速器、DeepSpeed、FSDP、混合精度、AI训练、深度学习。
对称性群识别器Skill symmetry-group-identifier
这个技能用于将识别的对称性映射到数学群,为神经网络架构设计提供数学基础。它帮助用户识别离散或连续对称性,匹配到具体群如循环群、二面体群、李群等,并验证群属性。关键词:对称性识别、群论映射、数学群、深度学习架构、神经网络对称性、SO(3)、SE(3)、量化交易分析(扩展应用)。
Torchtitan分布式LLM预训练Skill distributed-llm-pretraining-torchtitan
Torchtitan是一个用于大规模语言模型(LLM)预训练的PyTorch原生平台,支持4D并行(FSDP2、TP、PP、CP)、Float8训练和分布式检查点,适用于从8到512+ GPU的Llama、DeepSeek等模型的预训练,提供高效的训练速度和可扩展性。关键词:分布式训练、LLM预训练、PyTorch、Torchtitan、4D并行、Float8、深度学习、人工智能。
FlashAttention优化Skill optimizing-attention-flash
Flash Attention优化是一种用于Transformer模型注意力机制的技术,通过IO感知分块和重计算,实现2-4倍速度提升和10-20倍内存减少。适用于训练和推理长序列(>512 tokens)的Transformer模型,解决GPU内存问题,并支持PyTorch原生、高级功能如滑动窗口注意力和H100 FP8优化。关键词:Flash Attention,Transformer优化,内存效率,速度提升,深度学习,GPU加速,注意力机制。
AlphaFold数据库Skill alphafold-database
AlphaFold 数据库技能用于访问 AI 预测的蛋白质结构,支持通过 UniProt ID 检索结构、下载 PDB/mmCIF 文件、分析置信度指标(如 pLDDT 和 PAE),适用于药物发现、结构生物学研究和蛋白质工程。关键词:AlphaFold, 蛋白质结构预测, AI, 生物信息学, 药物研发
扩散对接模型Skill diffdock
扩散对接模型(DiffDock)是一种基于扩散模型的人工智能工具,用于分子对接,主要预测蛋白质与小分子配体的结合姿态,生成置信分数评估预测可靠性,支持虚拟筛选和批量处理,适用于结构基础药物设计、化学研究和药物研发。关键词包括:分子对接、扩散模型、蛋白质、配体、药物设计、虚拟筛选、深度学习、生物医药、AI应用。
scvi-toolsSkill scvi-tools
scvi-tools 是一个用于单细胞分析的深度学习框架,提供多种模型如 scVI、scANVI、totalVI、PeakVI、MultiVI、DestVI、veloVI 和 sysVI,用于数据集成、批校正、多模态分析、参考映射、RNA 速度分析等。关键词:深度学习、单细胞分析、scvi-tools、数据集成、批校正、多模态分析、参考映射、RNA速度分析。
PyTorch图神经网络库(PyG)Skill torch-geometric
PyTorch Geometric (PyG) 是一个基于 PyTorch 的图神经网络库,用于开发和训练图神经网络,适用于节点分类、图分类、链接预测、分子性质预测、社交网络分析等应用。关键词:图神经网络,深度学习,PyTorch,GNN,节点分类,图分类,链接预测,分子预测,社交网络分析,异构图,几何深度学习,GCN,GAT,GraphSAGE。
PyTorchLightningSkill pytorch-lightning
PyTorch Lightning 是一个深度学习框架,用于将 PyTorch 代码组织成模块化结构,自动化训练流程,支持多 GPU/TPU 训练、数据管理、回调机制、日志记录和分布式训练策略,以实现可扩展的神经网络训练。关键词:深度学习,PyTorch,训练自动化,多设备训练,分布式训练,神经网络,AI框架。
PyTorch几何库Skill torch-geometric
这个技能是用于开发和训练图神经网络(GNN)的Python库,基于PyTorch。它支持节点分类、图分类、链接预测、异构图处理、分子属性预测等应用,适用于社交网络分析、引用网络、3D几何数据等场景,是几何深度学习的强大工具。关键词:图神经网络、深度学习、PyTorch、GCN、GAT、GraphSAGE、节点分类、图分类、链接预测、分子属性预测、异构图。
模型训练Skill ModelTraining
此技能是关于使用PyTorch进行机器学习模型训练的全面指南。它涵盖从数据准备、训练循环设计、超参数优化到实验跟踪的完整工作流程。关键词包括机器学习、深度学习、PyTorch、模型训练、数据增强、超参数调整、实验跟踪、优化算法,旨在帮助开发者高效构建和调优AI模型,提升模型性能和可重复性。
分布式训练(Ray/多节点)Skill DistributedTraining(Ray/Multi-node)(Core)
本技能专注于使用Ray框架在多台机器或多个GPU上进行大规模机器学习模型训练的实践方法。核心内容包括数据并行与模型并行的策略选择、Ray Train/Tune库的应用模式,以及确保训练过程可复现、可追踪、可恢复的关键操作规范。关键词:分布式训练,Ray框架,多节点训练,数据并行,模型并行,MLflow,可复现性,检查点,故障恢复,机器学习扩展。