数据科学 Skill技能列表

4.5

混合整数优化Skill mixed-integer-optimization

混合整数优化是一种数学规划技术,用于解决包含离散变量和连续变量的优化问题。该技能涵盖混合整数线性规划(MILP)和混合整数非线性规划(MINLP)的建模与求解方法,包括分支定界算法、割平面法、Big-M重构、指示约束等关键技术。适用于资源分配、生产调度、投资组合优化、路径规划等需要离散决策的实际场景。关键词:混合整数规划,MILP,MINLP,优化算法,数学建模,运筹学,离散优化,分支定界,Gurobi,CPLEX。

4.5

数据版本管理工具Skill data-versioning-manager

数据版本管理工具是一款专为科学研究设计的专业技能,主要用于管理数据版本、追踪数据溯源和确保数据谱系完整性。该工具支持数据版本控制、变更追踪、转换记录、快照创建和团队协作,帮助研究人员实现数据可重复性、审计合规和高效协作。关键词:数据版本管理、数据溯源、数据谱系、科学可重复性、数据治理、版本控制、科研数据管理、数据审计

4.5

回归分析器Skill regression-analyzer

回归分析器技能是一个用于科学数据建模的专业工具,专注于执行全面的回归分析。它能够进行线性与广义模型拟合、模型诊断、处理多重共线性、生成预测并解释系数。该技能适用于量化金融、预测建模、数据分析、统计套利、因子挖掘、风险管理等场景,是数据科学家和量化研究员进行关系探索、效应估计和变量选择的强大助手。

4.5

科学可视化Skill scientific-visualization

科学可视化技能专注于使用Python数据可视化库(如matplotlib、seaborn、plotly)创建高质量、符合出版标准的科学图表。它支持多面板布局、误差棒、显著性标记、色盲友好调色板,并导出为PDF、EPS、TIFF等格式,适用于学术期刊提交和科研绘图。关键词:科学绘图、数据可视化、出版物图表、matplotlib、seaborn、plotly、科研绘图、学术出版、色盲友好、多面板图表。

4.5

数据管道架构师Skill data-pipeline-architect

数据管道架构师技能专注于设计和实现高效、可靠的数据处理流程,涵盖ETL与ELT模式、工作流编排、错误处理和数据质量验证,适用于数据仓库、数据湖等场景。关键词:数据管道、ETL开发、ELT模式、数据工程、数据质量、编排工具、Airflow、dbt、数据仓库、数据处理。

4.5

数据加载技能Skill load

此技能用于将数据文件从待处理区域高效加载到数据仓库中,实现ETL(提取、转换、加载)过程。它包括数据验证以符合模式、应用写策略(如APPEND、OVERWRITE)、强制执行数据质量期望(如唯一性检查)和隐私转换。支持多种文件格式(JSON、CSV、XML),并通过配置灵活管理数据加载。关键词:数据加载,ETL,数据仓库,数据验证,写策略,数据质量,隐私转换,文件格式,配置管理。

4.5

治理与主权书记员Skill governance-sovereignty

该技能用于处理与土著治理和主权主张相关的历史文档分析。作为治理与主权书记员,其主要职责是遵循严格的协议,手动分析JSON格式的文档任务,提取关于首席/理事会职权、土地所有权主张、自治实践以及抵制联邦政府强制措施的证据。工作流程包括获取任务、手动语义分析、生成符合法律级标准的JSON分析报告、提交结果以及处理异常。核心要求是保持中立、仅使用事实性语言、逐字引用,并严格避免自动化分析或主观推断。适用于历史研究、法律证据整理、土著权利主张支持等领域。 关键词:治理 主权 书记员 文档分析 证据提取 JSON处理 法律级标准 土著权利 历史研究 手动分析 协议遵循 数据治理

4.5

KPI仪表板设计Skill kpi-dashboard-design

这个技能用于设计和构建关键绩效指标仪表板,以清晰展示业务指标、支持数据分析和决策制定。关键词包括KPI、仪表板、数据可视化、商业智能、数据分析、指标监控。

4.5

数据模式与知识建模Skill data-schema-knowledge-modeling

数据模式与知识建模是一种用于设计数据库模式、构建知识图谱和定义数据模型的技能。它涉及识别实体、属性和关系,指定约束和不变量,以实现正确的系统实施和数据集成。关键词包括数据库设计、数据模型、知识图谱、实体关系建模、数据治理、模式迁移和数据可视化,适用于数据工程、数据治理和架构设计等场景。

4.5

知识图谱构建器Skill knowledge-graph-builder

这个技能专注于设计和构建知识图谱,用于表示实体、关系和语义连接,支持Neo4j、RDF和属性图的查询模式,适用于数据集成、智能推荐、欺诈检测、知识管理等场景。关键词:知识图谱,图数据库,Cypher查询,SPARQL,图算法,数据建模,语义网络。

4.5

高级数据科学家Skill senior-data-scientist

这个技能用于高级数据科学工作,专注于统计建模、机器学习、实验设计和生产级AI系统实现,适用于数据驱动决策、预测分析和企业级数据解决方案。关键词:数据科学、机器学习、AI、统计建模、预测分析、实验设计、因果推断。

4.5

Mermaid.jsv11图表生成Skill mermaidjs-v11

Mermaid.js v11 是一款强大的图表生成工具,允许用户通过简单的文本语法创建多种图表,如流程图、序列图、类图等,支持浏览器渲染、命令行转换和JavaScript API集成,广泛应用于技术文档、系统架构设计和项目管理中,关键词包括数据可视化、图表制作、Mermaid.js、技术文档。