机器学习 Skill技能列表
机器学习实验跟踪器Skill ml-experiment-tracker
这个技能提供机器学习实验的系统化指导,专注于跟踪、版本控制和可重现性实践,帮助开发者高效管理模型开发过程。关键词:机器学习、实验跟踪、MLflow、Weights & Biases、DVC、可重现性、模型版本控制、数据版本控制。
统一内存Skill unified-memory
这是一个专门针对CUDA统一内存和内存预取优化的专家技能。该技能提供AI驱动的统一内存操作,包括:配置托管内存分配、实现内存预取策略、处理页面错误分析、配置内存提示和建议、分析统一内存迁移、针对超额订阅场景进行优化以及比较托管与显式内存性能。
scikit-learn技能Skill scikit-learn
scikit-learn技能是一个用于机器学习的Python库,提供分类、回归、聚类、降维、数据预处理、模型评估和超参数调优等功能。它支持构建生产级别的机器学习管道,适用于数据科学和人工智能项目。关键词:机器学习, Python, scikit-learn, 分类, 回归, 聚类, 预处理, 模型评估。
JAX高性能数值计算Skill python-jax
JAX是一个Python库,专注于高性能数值计算,支持自动微分、即时编译(JIT)、向量化和GPU/TPU加速,适用于机器学习、深度学习和科学计算等场景。核心功能包括变换组合(grad、jit、vmap、pmap)、PyTrees处理以及优化循环模式。关键词:JAX, 自动微分, 高性能计算, 机器学习, 深度学习, Python, GPU加速, 数值优化, 科学计算, AI框架。
ML模型训练Skill MLModelTraining
本技能涉及使用scikit-learn、PyTorch和TensorFlow构建和训练机器学习模型,包括分类、回归和聚类任务。关键词包括:数据准备、特征工程、模型选择、超参数调优、模型验证和部署。
机器学习工程Skill ml-engineer
机器学习工程技能专注于构建和部署生产级机器学习系统,包括模型服务、特征工程、管道设计和监控,适用于机器学习模型集成和生产环境。关键词:机器学习、模型部署、特征工程、ML管道、生产系统、AI应用。
UMAP降维学习Skill umap-learn
UMAP降维学习是一种用于高维数据的非线性维度降维技术,适用于数据可视化、聚类预处理和机器学习特征工程。它通过保留数据的局部和全局结构,支持监督学习、参数化UMAP和与HDBSCAN等算法的集成。关键词:UMAP、降维、可视化、机器学习、数据科学、聚类、HDBSCAN、参数调优、特征工程、维度降维。
模型部署Skill ModelDeployment
这项技能涉及使用Flask、FastAPI、Docker等技术将训练好的机器学习模型部署到生产环境,包括REST API、批量处理、实时流处理、无服务器、边缘部署和模型服务等。
概率分析工具包Skill probabilistic-analysis-toolkit
概率分析工具包是用于分析随机化算法的专业工具,提供基于概率论和集中不等式的数学分析框架。该工具包支持期望值计算、切尔诺夫界、霍夫丁界、马尔可夫不等式、切比雪夫不等式等关键概率工具的应用,帮助算法工程师和研究人员评估随机算法的性能保证、失败概率和收敛速度。适用于算法复杂度分析、机器学习理论、密码学、分布式系统等需要严格概率保证的领域。 关键词:随机化算法分析,概率论工具,集中不等式,切尔诺夫界,霍夫丁界,算法复杂度,概率保证,期望值计算,矩生成函数,拉斯维加斯算法,蒙特卡洛算法
模型超参数调优Skill ModelHyperparameterTuning
这是一种系统化搜索最佳模型配置参数组合以最大化验证数据上性能的过程,涉及网格搜索、随机搜索、贝叶斯优化等多种调优方法,以及对不同模型类型的超参数进行调优,如树模型、神经网络、SVM等。
模型监控Skill ModelMonitoring
模型监控技能用于确保部署在生产环境中的机器学习模型维持良好的性能,通过检测数据漂移、概念漂移和性能退化来实现模型的可靠性和准确性。关键词包括:模型性能、数据漂移、概念漂移、异常检测、机器学习可观测性。
SHAP(沙普利可加性解释)Skill shap
SHAP技能用于机器学习模型的可解释性和解释性,通过SHAP值计算特征重要性、生成各种图表(如瀑布图和蜂群图)、调试模型、分析偏差和公平性。支持树模型、深度学习模型和线性模型,是实现可解释AI的关键工具。关键词:模型解释、可解释AI、SHAP值、特征重要性、机器学习、数据可视化、偏差分析、深度学习、树模型、线性模型。