数据科学 Skill技能列表

4.5

SaaS财务指标速查表Skill finance-metrics-quickref

此技能提供SaaS公司财务指标的快速参考,包括公式、基准和决策框架,适用于产品经理、投资者和财务人员快速查询、评估业务健康、进行决策支持。关键词:SaaS、财务指标、快速参考、决策框架、业务分析、数据驱动。

4.5

SaaS收入增长指标分析Skill saas-revenue-growth-metrics

本技能专注于计算和解释SaaS产品的收入、留存和增长指标,包括收入、ARPU/ARPA、MRR/ARR、流失率、NRR、扩展和队列分析。用于评估SaaS业务健康、产品市场契合度,支持数据驱动的增长决策。关键词:SaaS、收入分析、留存指标、增长评估、数据驱动。

4.5

数据处理器Skill data-processor

数据处理器是一个用于处理和验证各种数据输入的工具,适用于数据清洗、验证和预处理。关键词包括数据处理、数据验证、Python工具、数据输入处理,方便SEO搜索和数据管理应用。

4.5

预加载技能Skill preload

该技能用于在数据加载流程中检查landing或pending区域的文件可用性,确保文件就绪后触发加载,适用于数据工程、ETL开发和自动化编排,关键词:文件检查、数据加载、编排、ETL、数据仓库、预加载。

4.5

数据迁移Skill data-migration

数据迁移技能专注于安全、高效地执行数据库和数据系统的迁移工作,包括规划迁移策略、实施数据转换、确保零停机部署以及设计回滚机制,以维护数据完整性和系统稳定性。关键词:数据库迁移,数据转换,零停机,安全架构,回滚策略,数据完整性。

4.5

DAG生成技能Skill dag-generate

该技能用于从 Starlake 项目配置自动生成 Airflow 或 Dagster 的 DAG(有向无环图)文件,支持数据加载和变换任务的编排,适用于数据工程、ETL 开发和自动化工作流管理。关键词:DAG, Airflow, Dagster, Starlake, 数据工程, ETL, 任务编排, 工作流。

4.5

视觉设计Skill visual-design

这个技能用于生成数据图表和视觉设计,包括海报、信息图、图表、艺术品等。它支持使用Python库如matplotlib、plotly、Pillow、reportlab等进行图像和PDF输出,适用于数据可视化、海报设计、信息图制作等场景。关键词:数据可视化、视觉设计、图表生成、信息图制作、海报设计、Python数据可视化工具。

4.5

数据完整性守护者Skill data-integrity-guardian

数据完整性守护者是一个专注于数据库迁移安全、数据完整性验证和隐私合规的技能。它用于审查数据库迁移、验证数据约束、确保事务完整性和隐私要求合规,以保护数据免于丢失或损坏。关键词:数据库安全,数据迁移,完整性检查,隐私合规,数据治理,ACID属性。

4.5

数据管道架构师Skill data-pipeline-architect

数据管道架构师技能专注于设计和实现高效、可靠的数据处理流程,涵盖ETL与ELT模式、工作流编排、错误处理和数据质量验证,适用于数据仓库、数据湖等场景。关键词:数据管道、ETL开发、ELT模式、数据工程、数据质量、编排工具、Airflow、dbt、数据仓库、数据处理。

4.5

时间序列分析师Skill time-series-analyst

该技能专注于时间序列数据的分析,用于识别模式、趋势、季节性和异常,并通过统计方法如ARIMA和机器学习方法如Prophet进行预测。适用于数据分析、预测建模和量化金融等领域。关键词:时间序列分析、预测建模、异常检测、数据挖掘、机器学习。

4.5

ApacheBeam核心概念技能Skill beam-concepts

Apache Beam是一个用于批处理和流数据处理的开源编程模型,支持构建可移植的数据管道,适用于数据工程、ETL开发和云原生应用。关键词:数据处理、批处理、流处理、Apache Beam、数据管道、数据工程、ETL开发、云原生。

4.5

数据加载技能Skill load

此技能用于将数据文件从待处理区域高效加载到数据仓库中,实现ETL(提取、转换、加载)过程。它包括数据验证以符合模式、应用写策略(如APPEND、OVERWRITE)、强制执行数据质量期望(如唯一性检查)和隐私转换。支持多种文件格式(JSON、CSV、XML),并通过配置灵活管理数据加载。关键词:数据加载,ETL,数据仓库,数据验证,写策略,数据质量,隐私转换,文件格式,配置管理。