机器学习 Skill技能列表

4.5

SHAP模型可解释性分析Skill shap

此技能用于机器学习模型的可解释性分析,通过SHAP值解释模型预测、计算特征重要性、生成可视化图表,帮助用户理解模型行为、调试模型、分析公平性,并实现可解释AI。关键词:SHAP、机器学习、可解释性、特征重要性、模型解释、AI解释性、数据科学、人工智能、量化交易、风险评估。

4.5

机器学习管道工作流程Skill ml-pipeline-workflow

这个技能提供了构建端到端机器学习操作(MLOps)管道的全面指导,涵盖从数据准备到模型训练、验证、部署和监控的全生命周期。它适用于自动化ML工作流、提高模型可复现性和生产部署效率。关键词包括:MLOps、管道编排、数据准备、模型训练、验证、部署、自动化、机器学习。

4.5

模型卡生成器Skill model-card-generator

模型卡生成器是一个遵循谷歌模型卡框架的自动化文档工具,用于为机器学习模型创建标准化、全面的技术文档。该技能能自动生成包含模型详情、预期用途、性能指标、伦理考量、局限性和版本历史等关键部分的模型卡,支持HTML、Markdown和JSON多种输出格式,旨在提升机器学习项目的透明度、可解释性和可维护性。关键词:模型卡,机器学习文档,模型可解释性,AI伦理,模型评估,自动化文档,MLOps,模型治理。

4.5

MLOps工程师Skill mlops-engineer

MLOps工程师是专注于机器学习运维的专业角色,负责连接数据科学与DevOps,实现ML模型从开发到生产部署的全流程自动化与管理。核心工作包括构建和优化ML流水线、实施模型版本控制与注册、管理特征存储、部署生产环境ML服务,以及持续监控模型性能与数据漂移。关键词:机器学习运维,MLOps,ML流水线,模型部署,特征存储,模型版本控制,ML监控,Kubeflow,MLflow,CI/CD,自动化,生产环境。

4.5

feast特征存储Skill feast-feature-store

这是一个用于在线和离线特征服务、特征注册以及确保机器学习系统中训练-服务一致性的特征存储管理技能。关键词包括:特征存储、Feast、Redis、PostgreSQL、BigQuery、Snowflake、Parquet文件。

4.5

梯度方法Skill gradient-methods

这个技能专注于优化问题中的梯度方法,提供全面的问题解决策略,包括梯度下降、步长选择、加速方法和牛顿法等,适用于机器学习、数据科学和量化金融等领域的数值优化。关键词:梯度下降,优化算法,机器学习,数值优化,BFGS,共轭梯度,步长选择。

4.5

sklearn模型训练器Skill sklearn-model-trainer

sklearn模型训练器是一个基于Python scikit-learn库的机器学习模型开发技能,提供完整的自动化机器学习工作流程。该技能支持分类、回归、聚类等多种模型训练,包含交叉验证、超参数调优、管道构建和模型序列化等核心功能。适用于数据科学家、机器学习工程师和AI开发者快速构建和部署机器学习模型。关键词:scikit-learn, 机器学习, 模型训练, 交叉验证, 超参数调优, 管道构建, 模型序列化, Python, 自动化ML

4.5

变分量子分类器训练器Skill vqc-trainer

变分量子分类器训练器是一种专注于量子机器学习(QML)的专业技能,用于训练基于变分量子电路的分类模型。它涵盖数据编码、量子电路设计、梯度优化(如SPSA和Adam)、超参数调优、过拟合检测和学习曲线分析等关键环节,适用于量子计算与人工智能交叉领域的研究和应用。关键词:量子机器学习、变分量子分类器、数据编码、梯度优化、量子电路、超参数调优、过拟合检测、交叉验证。

4.5

模板卷积优化Skill stencil-convolution

stencil-convolution技能是专门针对GPU优化的模板和卷积模式实现的专家技能,用于科学计算、图像处理和数值模拟,涉及邻域计算的AI驱动操作。

4.5

高级评估Skill advanced-evaluation

这个技能用于构建和优化大型语言模型输出的评估系统,包括自动化评估管道、比较模型响应、创建评分标准等,关键词包括LLM评估、自动化质量评估、偏见减轻。

4.5

TensorBoardSkill tensorboard

TensorBoard是Google开发的机器学习可视化工具,用于可视化训练指标、调试模型、比较实验、可视化模型图和性能分析,支持PyTorch和TensorFlow框架。关键词:TensorBoard、机器学习、可视化、训练指标、模型调试、深度学习、实验跟踪、性能分析。

4.5

Arboreto基因调控网络推断工具Skill arboreto

Arboreto是一个用于从基因表达数据推断基因调控网络(GRN)的计算库,采用可扩展机器学习算法如GRNBoost2和GENIE3。适用于转录组学数据分析,包括批量RNA-seq和单细胞RNA-seq,以识别转录因子与靶基因的调控关系。支持分布式计算处理大规模数据集,提高分析效率。关键词:基因调控网络、GRN、基因表达数据、转录因子、GRNBoost2、GENIE3、单细胞RNA-seq、分布式计算、机器学习推断。