机器学习 Skill技能列表

4.5

AI/MLObservabilityandMonitoringSkill AI/MLObservabilityandMonitoring

这个技能提供了一套全面的指南,用于监控生产环境中的人工智能和机器学习系统,包括大型语言模型(LLMs)、检索-生成(RAG)应用和传统机器学习模型。它涵盖了监控堆栈的搭建、关键性能指标的跟踪、模型性能监控、数据漂移检测、日志记录、追踪技术、告警策略、仪表板配置、A/B测试监控、成本优化等多个方面,是确保AI系统可靠性和性能的关键工具。

4.5

ML模型训练Skill MLModelTraining

本技能涉及使用scikit-learn、PyTorch和TensorFlow构建和训练机器学习模型,包括分类、回归和聚类任务。关键词包括:数据准备、特征工程、模型选择、超参数调优、模型验证和部署。

4.5

W&B实验跟踪器Skill wandb-experiment-tracker

W&B实验跟踪器是一款专为机器学习与深度学习项目设计的集成技能,用于高效管理实验全生命周期。它提供实验日志记录与可视化、超参数自动扫描优化、模型与数据集工件版本控制、团队协作以及自定义报告生成等功能。核心关键词包括:机器学习实验跟踪、深度学习超参数调优、W&B集成、模型版本管理、AI实验可视化、团队协作平台。

4.5

JAX高性能数值计算Skill python-jax

JAX是一个Python库,专注于高性能数值计算,支持自动微分、即时编译(JIT)、向量化和GPU/TPU加速,适用于机器学习、深度学习和科学计算等场景。核心功能包括变换组合(grad、jit、vmap、pmap)、PyTrees处理以及优化循环模式。关键词:JAX, 自动微分, 高性能计算, 机器学习, 深度学习, Python, GPU加速, 数值优化, 科学计算, AI框架。

4.5

DVC数据集版本控制Skill dvc-dataset-versioning

DVC数据集版本控制技能,专为机器学习与数据科学工作流设计,提供数据版本追踪、变更管理、管道自动化及实验可复现性保障。核心功能包括数据血缘追踪、远程存储同步、缓存优化与实验对比,适用于数据工程、模型训练及特征工程等场景,提升团队协作效率与项目可维护性。关键词:DVC版本控制、数据管道、机器学习可复现性、数据血缘追踪、远程存储管理、实验管理、数据工程、MLOps。

4.5

BAML集成技能Skill baml-integration

BAML 集成技能是一套通用的模式,用于在任何项目中与边界机器学习(BAML)合作,提供类型安全的大语言模型(LLM)提示和自动代码生成,支持 Python 和 TypeScript,适用于跨语言代码生成和客户端包装。

4.5

DeepChem化学机器学习技能Skill deepchem

DeepChem化学机器学习技能是一个全面的Python库,专为化学、材料科学和生物学领域的机器学习应用设计。它支持分子数据加载与处理、多样分子特征化方法(如指纹、图表示)、模型训练与评估,特别适用于分子属性预测(ADMET、毒性)、药物发现、材料设计和生物分子分析。提供预训练模型(如ChemBERTa、GROVER)和MoleculeNet基准数据集,方便快速实验和性能评估。关键词:DeepChem、化学机器学习、分子特征化、图神经网络、预训练模型、药物发现、材料科学、MoleculeNet基准。

4.5

近似比计算器Skill approximation-ratio-calculator

近似比计算器是一个专注于分析和证明优化算法近似性能的专业工具。它提供LP松弛分析、整数性间隙计算、随机舍入方案设计、近似因子推导等功能,帮助研究人员和工程师评估算法的近似保证,分析PTAS/FPTAS可行性,并研究不可近似性结果。适用于算法设计、复杂性理论研究和优化问题求解。 关键词:近似算法,近似比,LP松弛,整数性间隙,随机舍入,PTAS,FPTAS,不可近似性,优化算法,复杂性理论

4.5

DeepChem(深度化学机器学习工具包)Skill deepchem

DeepChem 是一个用于化学、材料科学和生物学的 Python 机器学习库,专注于分子性质预测(如溶解度、毒性)、药物发现、材料设计和生物分子分析。它提供分子特征化、图神经网络(GNNs)、预训练模型和 MoleculeNet 基准数据集,支持迁移学习和深度学习应用。关键词:机器学习、化学、药物发现、分子性质预测、图神经网络、Python 库。

4.5

Scikit-learn机器学习库Skill scikit-learn

Scikit-learn 是一个 Python 的机器学习库,用于数据分析和预测建模,支持分类、回归、聚类、降维、预处理、模型评估和超参数调优。关键词:机器学习,Python,数据分析,预测建模,scikit-learn,分类,回归,聚类。

4.5

Molfeat分子特征化库Skill molfeat

Molfeat是一个用于分子特征化的Python库,提供100多种预训练嵌入和手工特征器,可将化学结构转换为数值表示,用于QSAR建模、虚拟筛选、相似性搜索等机器学习任务。关键词:分子特征化、机器学习、化学信息学、QSAR、虚拟筛选、特征提取。

4.5

UMAP降维学习Skill umap-learn

UMAP降维学习是一种用于高维数据的非线性维度降维技术,适用于数据可视化、聚类预处理和机器学习特征工程。它通过保留数据的局部和全局结构,支持监督学习、参数化UMAP和与HDBSCAN等算法的集成。关键词:UMAP、降维、可视化、机器学习、数据科学、聚类、HDBSCAN、参数调优、特征工程、维度降维。