数据科学 Skill技能列表

4.5

高级数据工程师Skill senior-data-engineer

高级数据工程师技能专注于构建和管理可扩展的数据基础设施、ETL/ELT系统、数据管道和数据质量,支持生产级AI/ML和数据系统。关键技术包括Python、SQL、Spark、Airflow、dbt、Kafka等,适用于数据架构设计、数据工作流优化、数据治理等场景,助力企业实现数据驱动的决策和创新。关键词:数据工程、ETL、数据管道、数据基础设施、Spark、Airflow、Python、SQL、DataOps。

4.5

Python优化Skill python-optimization

Python优化技能提供数学优化在Python中的全面指导,包括问题分类、库选择(如scipy、pyomo、cvxpy、GEKKO)、求解器配置和实现模式,适用于线性规划、二次规划、非线性规划、混合整数规划、凸优化和全局优化问题。关键词:Python优化,数学优化,scipy,pyomo,cvxpy,GEKKO,线性规划,非线性规划,优化算法,参数估计。

4.5

数据流设计Skill data-flow

数据流设计技能用于根据需求描述设计和实施数据管道架构,包括数据源集成、转换处理、目标系统部署,支持批处理、流处理、Lambda、Kappa等多种模式,适用于数据仓库、数据湖、机器学习、商业智能等应用场景。关键词:数据管道、ETL、流处理、数据架构、数据工程、Spark、Flink、Kafka、数据湖仓。

4.5

数据模式与知识建模Skill data-schema-knowledge-modeling

数据模式与知识建模是一种用于设计数据库模式、构建知识图谱和定义数据模型的技能。它涉及识别实体、属性和关系,指定约束和不变量,以实现正确的系统实施和数据集成。关键词包括数据库设计、数据模型、知识图谱、实体关系建模、数据治理、模式迁移和数据可视化,适用于数据工程、数据治理和架构设计等场景。

4.5

dbt项目分析器Skill dbt-project-analyzer

dbt项目分析器是一款用于评估和优化dbt(data build tool)数据转换项目的专业工具。它能自动分析项目结构、模型依赖、测试覆盖率、文档完整性和命名规范,检测性能瓶颈与循环依赖,并提供基于最佳实践的具体改进建议。适用于数据工程师、数据分析师和DevOps团队,帮助提升数据仓库项目的质量、可维护性和运行效率。关键词:dbt分析,数据工程,数据仓库优化,测试覆盖率,模型依赖分析,性能调优,CI/CD集成,数据治理。

4.5

ACL依赖关系图生成技能Skill acl-dependencies

该技能用于生成基于YAML配置中ACL(访问控制列表)定义的用户/组与数据库表之间访问权限的可视化依赖关系图。关键词:ACL、访问控制、依赖关系、可视化图、数据安全、权限管理、YAML配置、数据治理、DevOps工具。

4.5

Mermaid.jsv11图表生成Skill mermaidjs-v11

Mermaid.js v11 是一款强大的图表生成工具,允许用户通过简单的文本语法创建多种图表,如流程图、序列图、类图等,支持浏览器渲染、命令行转换和JavaScript API集成,广泛应用于技术文档、系统架构设计和项目管理中,关键词包括数据可视化、图表制作、Mermaid.js、技术文档。

4.5

分布式NoSQL数据库专家Skill nosql-expert

本技能提供分布式NoSQL数据库(如Cassandra和DynamoDB)的专业设计模式和指导,包括思维模型、查询优先建模、单表设计、避免热分区等,适用于大规模系统开发、数据工程和云计算场景。关键词:分布式NoSQL数据库、Cassandra、DynamoDB、查询优先建模、热分区、数据工程。

4.5

敏感性分析工具包Skill sensitivity-analysis-toolkit

本工具包是一个专注于数学优化的敏感性分析解决方案,主要用于评估优化模型的鲁棒性。核心功能包括对偶变量计算、影子价格分析、参数规划、紧约束识别和后最优性分析。它帮助用户理解模型参数变化对最优解的影响,支持鲁棒优化建模,适用于金融、工程、供应链等领域的决策支持系统。 关键词:敏感性分析,优化模型,对偶变量,影子价格,参数规划,鲁棒优化,后最优性分析,数学建模,决策支持

4.5

统计建模与计量经济学分析Skill statsmodels

Statsmodels 是 Python 的一个开源库,专门用于统计建模、计量经济学分析和时间序列分析。它提供了广泛的统计方法,包括线性回归、广义线性模型、逻辑回归、ARIMA 等,用于数据分析和预测。关键词:统计建模,Python,回归分析,时间序列,计量经济学,假设检验,数据分析,预测建模。

4.5

scikit-survival:生存分析工具包Skill scikit-survival

scikit-survival是一个基于scikit-learn的Python库,专门用于生存分析和时间到事件建模。它处理截尾数据,提供多种模型如Cox比例风险模型、随机生存森林和生存支持向量机,并支持模型评估如一致性指数和Brier分数。适用于医学研究、金融风险评估和生物统计等领域。关键词:生存分析、Python、scikit-survival、截尾数据、Cox模型、机器学习、预测建模、数据分析。

4.5

商业分析报告生成器Skill business-analytics-reporter

商业分析报告生成器是一款基于数据驱动的商业智能工具,专门用于处理和分析CSV格式的销售与营收数据。它能够自动识别业务薄弱环节,生成深度统计洞察,并提供基于商业框架的战略改进建议。核心功能包括数据探索、趋势分析、类别绩效评估、波动性检测以及可执行的策略推荐。适用于企业绩效评估、销售数据分析、业务优化决策等场景,帮助用户快速定位问题并制定数据驱动的改进方案。关键词:商业数据分析,销售绩效报告,营收增长策略,业务薄弱环节识别,数据驱动决策,商业智能BI,统计洞察,战略建议生成。