机器学习 Skill技能列表

4.5

ML实验追踪器Skill ml-experiment-tracker

这个技能提供机器学习实验的系统化追踪、版本控制和可重复性指导,使用工具如MLflow、Weights & Biases和DVC,帮助数据科学家和工程师管理模型开发过程,确保实验可重现和高效比较。关键词:机器学习,实验追踪,版本控制,可重复性,MLflow,W&B,DVC,模型开发,数据科学。

4.5

向量数据库调优Skill vector-database-tuning

这项技能涉及向量数据库的性能优化,包括HNSW参数调整、分块策略、混合搜索配置等,以提高RAG和语义搜索的性能。

4.5

高级机器学习工程师Skill senior-ml-engineer

本技能集专为构建和运维企业级AI/ML系统而设计,核心能力包括:机器学习模型生产化部署、MLOps全流程实施、可扩展机器学习平台搭建、大语言模型集成与微调、RAG系统开发、AI智能体应用。关键词:机器学习工程,MLOps,模型部署,大语言模型集成,RAG系统,AI智能体,生产级AI系统,可扩展架构,特征存储,模型监控。

4.5

模型部署Skill ModelDeployment

这项技能涉及使用Flask、FastAPI、Docker等技术将训练好的机器学习模型部署到生产环境,包括REST API、批量处理、实时流处理、无服务器、边缘部署和模型服务等。

4.5

推荐系统Skill RecommendationSystem

构建协同和基于内容的推荐引擎,用于产品推荐、个性化和提高用户参与度

4.5

模型超参数调优Skill ModelHyperparameterTuning

这是一种系统化搜索最佳模型配置参数组合以最大化验证数据上性能的过程,涉及网格搜索、随机搜索、贝叶斯优化等多种调优方法,以及对不同模型类型的超参数进行调优,如树模型、神经网络、SVM等。

4.5

模型优化Skill ModelOptimization

模型优化技能涉及一系列技术,用于在保持准确度的同时减小机器学习模型的大小、提高推理速度。关键技术包括量化、剪枝、知识蒸馏等,旨在实现模型的高效部署。

4.5

机器学习实验跟踪器Skill ml-experiment-tracker

这个技能提供机器学习实验的系统化指导,专注于跟踪、版本控制和可重现性实践,帮助开发者高效管理模型开发过程。关键词:机器学习、实验跟踪、MLflow、Weights & Biases、DVC、可重现性、模型版本控制、数据版本控制。

4.5

Trackio机器学习实验跟踪Skill hugging-face-trackio

Trackio是一个机器学习实验跟踪技能,用于记录和可视化训练指标,支持Python API和CLI接口,可同步到Hugging Face Spaces进行实时监控,提供JSON输出便于自动化处理,关键词包括机器学习、实验跟踪、日志记录、可视化、Hugging Face Spaces、自动化。

4.5

TorchDrug药物发现工具箱Skill torchdrug

TorchDrug 是一个基于 PyTorch 的机器学习工具箱,专注于药物发现和分子科学领域。它提供图神经网络模型、预训练架构和多种任务定义,用于分子属性预测、蛋白质建模、知识图谱推理、分子生成和逆合成规划等应用。包含 40+ 数据集和 20+ 模型架构,支持化学、生物学和生物医学图的机器学习工作流程。关键词:药物发现、机器学习、图神经网络、PyTorch、分子属性预测、蛋白质建模、生物医药、AI 应用。

4.5

parallel-patternsSkill parallel-patterns

GPU并行算法设计模式与实现,包括并行归约、扫描/前缀和、直方图、并行排序、流压缩等高效算法

4.5

概率分析工具包Skill probabilistic-analysis-toolkit

概率分析工具包是用于分析随机化算法的专业工具,提供基于概率论和集中不等式的数学分析框架。该工具包支持期望值计算、切尔诺夫界、霍夫丁界、马尔可夫不等式、切比雪夫不等式等关键概率工具的应用,帮助算法工程师和研究人员评估随机算法的性能保证、失败概率和收敛速度。适用于算法复杂度分析、机器学习理论、密码学、分布式系统等需要严格概率保证的领域。 关键词:随机化算法分析,概率论工具,集中不等式,切尔诺夫界,霍夫丁界,算法复杂度,概率保证,期望值计算,矩生成函数,拉斯维加斯算法,蒙特卡洛算法