机器学习 Skill技能列表

4.5

UMAP降维学习Skill umap-learn

UMAP降维学习是一种用于高维数据的非线性维度降维技术,适用于数据可视化、聚类预处理和机器学习特征工程。它通过保留数据的局部和全局结构,支持监督学习、参数化UMAP和与HDBSCAN等算法的集成。关键词:UMAP、降维、可视化、机器学习、数据科学、聚类、HDBSCAN、参数调优、特征工程、维度降维。

4.5

Molfeat分子特征化库Skill molfeat

Molfeat是一个用于分子特征化的Python库,提供100多种预训练嵌入和手工特征器,可将化学结构转换为数值表示,用于QSAR建模、虚拟筛选、相似性搜索等机器学习任务。关键词:分子特征化、机器学习、化学信息学、QSAR、虚拟筛选、特征提取。

4.5

模型监控Skill ModelMonitoring

模型监控技能用于确保部署在生产环境中的机器学习模型维持良好的性能,通过检测数据漂移、概念漂移和性能退化来实现模型的可靠性和准确性。关键词包括:模型性能、数据漂移、概念漂移、异常检测、机器学习可观测性。

4.5

对称性验证套件Skill symmetry-validation-suite

对称性验证套件是一个用于实证测试数据或模型中对称性假设的技能。它提供完整的测试协议、统计指标和工作流程,帮助用户在构建等变架构前验证对称性的正确性,避免因错误假设导致性能下降。关键词:对称性验证、等变性测试、数据验证、模型测试、人工智能、机器学习、深度学习、数据科学。

4.5

kubeflow-pipeline-executorSkill kubeflow-pipeline-executor

Kubeflow Pipelines执行器技能,专注于机器学习工作流编排、组件管理和Kubernetes原生机器学习操作。提供完整的MLOps解决方案,包括管道定义、编译、运行、调度、版本控制和可视化功能。关键词:Kubeflow Pipelines,机器学习工作流,MLOps,Kubernetes,管道编排,模型训练,模型部署,分布式训练,Argo Workflows,云原生机器学习。

4.5

DataPreprocessingSkill DataPreprocessing

数据预处理技能涵盖了从原始数据转换为适合机器学习模型训练的格式的全过程,包括数据清洗、特征工程、归一化、编码分类变量等关键步骤。

4.5

AI/MLObservabilityandMonitoringSkill AI/MLObservabilityandMonitoring

这个技能提供了一套全面的指南,用于监控生产环境中的人工智能和机器学习系统,包括大型语言模型(LLMs)、检索-生成(RAG)应用和传统机器学习模型。它涵盖了监控堆栈的搭建、关键性能指标的跟踪、模型性能监控、数据漂移检测、日志记录、追踪技术、告警策略、仪表板配置、A/B测试监控、成本优化等多个方面,是确保AI系统可靠性和性能的关键工具。

4.5

SHAP(沙普利可加性解释)Skill shap

SHAP技能用于机器学习模型的可解释性和解释性,通过SHAP值计算特征重要性、生成各种图表(如瀑布图和蜂群图)、调试模型、分析偏差和公平性。支持树模型、深度学习模型和线性模型,是实现可解释AI的关键工具。关键词:模型解释、可解释AI、SHAP值、特征重要性、机器学习、数据可视化、偏差分析、深度学习、树模型、线性模型。

4.5

FAIRChem技能Skill fairchem

FAIRChem是一个用于材料科学和量子化学的机器学习框架,提供预训练的UMA模型和ASE集成,支持快速能量、力、应力预测,适用于催化、分子、晶体、MOFs等模拟和优化,加速计算并提高效率。关键词:机器学习、材料科学、量子化学、UMA模型、ASE集成、模拟预测、催化研究、几何优化、分子动力学。

4.5

ML模型训练Skill MLModelTraining

本技能涉及使用scikit-learn、PyTorch和TensorFlow构建和训练机器学习模型,包括分类、回归和聚类任务。关键词包括:数据准备、特征工程、模型选择、超参数调优、模型验证和部署。

4.5

Pymoo多目标优化框架Skill pymoo

Pymoo是一个Python多目标优化框架,提供NSGA-II、NSGA-III、MOEA/D等先进算法,用于解决单目标和多目标优化问题,支持约束处理、基准测试(如ZDT、DTLZ)、遗传算子定制和多标准决策制定,适用于工程设计、量化金融、机器学习等领域的优化任务。关键词:多目标优化、Python框架、NSGA-II、Pareto前沿、约束处理、进化算法、工程设计、量化策略。

4.5

PyTorch部署Skill PyTorchDeployment

这项技能涵盖了如何将 PyTorch 模型部署到生产环境,包括模型导出、优化、服务部署、监控和性能基准测试等关键步骤,是实现深度学习模型从开发到上线的重要指南。