人工智能 Skill技能列表
nanoGPTSkill nanogpt
nanoGPT是一个简化的GPT实现技能,用于教育和实验目的。它通过约300行代码帮助学习和重现GPT-2模型,支持文本生成和模型训练,适合AI初学者、研究人员和快速原型开发。关键词:nanoGPT, GPT模型, 深度学习, 变压器架构, 教育实现, 文本生成, AI学习。
Mamba架构Skill mamba-architecture
Mamba是一种高效的选择性状态空间模型(SSM)架构,专为序列建模设计,如自然语言处理(NLP)。它具有线性复杂度O(n),相比Transformer的O(n²),推理速度快5倍,支持长达百万令牌的序列,无需KV缓存,内存使用低。适用于长上下文任务、流式应用和高效推理场景。关键词:Mamba, 状态空间模型, SSM, 线性复杂度, 高效推理, NLP, 深度学习, AI模型架构。
LitGPT模型实现与微调技能Skill implementing-llms-litgpt
这个技能专注于使用 Lightning AI 的 LitGPT 工具来实现和训练大型语言模型(LLM),支持 20 多种预训练架构(如 Llama、Gemma、Phi 等)。适用于教育目的、生产级微调(使用 LoRA/QLoRA)、单文件实现等场景。关键词包括:LitGPT、LLM、微调、LoRA、QLoRA、模型训练、Lightning AI。
权重与偏置(Weights&Biases)Skill weights-and-biases
权重与偏置(W&B)是一个机器学习实验跟踪与MLOps平台,用于自动记录实验指标、实时可视化训练过程、优化超参数、管理模型注册和协作团队项目。关键词:机器学习实验跟踪,MLOps,W&B,超参数扫描,模型管理,协作工具,AI开发。
TensorBoardSkill tensorboard
TensorBoard是Google开发的机器学习可视化工具,用于可视化训练指标、调试模型、比较实验、可视化模型图和性能分析,支持PyTorch和TensorFlow框架。关键词:TensorBoard、机器学习、可视化、训练指标、模型调试、深度学习、实验跟踪、性能分析。
MLflow机器学习生命周期管理技能Skill mlflow
MLflow是一个框架无关的机器学习生命周期管理平台,用于跟踪机器学习实验、管理模型注册表、部署模型到生产环境和重现实验。它支持多种ML框架如PyTorch、TensorFlow、Scikit-Learn,并集成团队协作、自动记录、版本控制和SEO关键词包括机器学习、AI、模型部署、实验跟踪、MLOps。
TransformerLens机制解释性库Skill transformer-lens-interpretability
TransformerLens 是一个用于Transformer模型机制解释性研究的Python库,允许用户通过钩子点和激活缓存来检查和操作模型内部状态,支持激活修补、电路分析、注意力模式研究等功能,常用于AI模型的解释性分析,特别是在自然语言处理领域。关键词:机械解释性、Transformer模型、激活缓存、钩子点、电路分析、AI解释性、深度学习、NLP。
稀疏自编码器训练与分析技能Skill sparse-autoencoder-training
SAELens技能用于训练和分析稀疏自编码器,以将密集的神经网络激活分解为稀疏、可解释的特征,适用于机制可解释性研究、特征发现和叠加分析。关键词:稀疏自编码器、SAE、机制可解释性、特征发现、神经网络激活、深度学习、NLP、人工智能。
Pyvene因果干预技能Skill pyvene-interventions
Pyvene因果干预技能是一种用于对PyTorch神经网络模型进行因果分析和干预的技术,支持因果追踪、激活修补、交换干预训练等方法,用于理解和改进模型行为,适用于大模型微调和AI应用场景。关键词:因果干预、PyTorch、神经网络、模型解释、激活修补、深度学习、AI工具。
nnsight远程神经网络解释工具Skill nnsight-remote-interpretability
nnsight是一个用于解释和操作神经网络内部的工具,支持通过NDIF远程执行,适用于大规模模型的可解释性实验。它允许研究人员在任何PyTorch模型上运行相同代码,无需本地GPU资源。关键词:神经网络解释,远程执行,nnsight,NDIF,大模型分析,PyTorch模型,深度学习可解释性。
洛基模式Skill loki-mode
这是一个多代理自主启动系统,专为Claude Code设计,能够从产品需求文档(PRD)到完全部署、产生收益的产品,全程零人工干预。它协调100多个专业代理,涵盖工程、质量保证、DevOps、安全、数据/机器学习、业务运营、营销、人力资源和客户成功等领域,实现任务调度、并行代码审查、自动化部署、A/B测试、客户反馈循环和事件响应。关键词:AI代理、自动化开发、多代理系统、自主启动、Claude Code、软件开发自动化、人工智能智能体。
LLM应用模式Skill llm-app-patterns
这是一个关于构建生产就绪的大型语言模型(LLM)应用模式的技能。涵盖了 RAG 管道、智能体架构、提示 IDE 和 LLMOps 监控,适用于设计 AI 应用、实现 RAG、构建智能体或设置 LLM 可观测性。关键词:LLM 应用、RAG、智能体、提示工程、LLMOps。