数据科学 Skill技能列表
Kafka工程师Skill kafka-engineer
Kafka工程师技能专注于Apache Kafka分布式流处理平台,提供实时数据管道构建、事件驱动架构设计、流处理应用开发(Kafka Streams/ksqlDB)以及数据集成(Kafka Connect)的专业能力。核心关键词包括:实时数据处理、事件流、微服务通信、数据管道、流计算、消息队列、大数据集成、容错系统、性能调优。适用于构建高吞吐、低延迟的实时数据平台,支撑金融风控、电商交易、物联网监控等场景。
Seaborn数据可视化库Skill seaborn
Seaborn 是一个强大的Python数据可视化库,专注于统计图形,帮助数据分析师和科学家快速探索数据分布、关系和模式。它集成pandas,提供美观的默认主题和颜色调色板,支持多种图表类型如散点图、线图、箱线图、热图等,适用于探索性数据分析和报告制作。关键词:Python数据可视化,统计图形,Seaborn库,探索性数据分析,图表制作。
GreatExpectations生成器Skill GreatExpectationsGenerator
Great Expectations 生成器是一款自动化工具,用于根据数据画像和业务规则创建数据质量期望套件。它支持自定义期望、检查点配置、数据文档生成和验证分析,并能与 dbt、Airflow 等工具集成,确保数据质量在 ETL/ELT 管道中得到有效监控和强制执行。关键词:数据质量,Great Expectations,期望套件,ETL,数据治理,自动化测试,数据验证,dbt,Airflow。
需求预测框架Skill afrexai-demand-forecasting
本技能提供一套完整的需求预测框架,整合时间序列分析、因果回归模型和定性判断方法,用于企业季度/年度需求规划、新产品上市预测、库存优化和产能决策。核心功能包括混合预测模型、准确性评估指标(如MAPE)、需求细分(ABC-XYZ)、安全库存计算和情景规划。适用于制造业、零售、快消品、SaaS等多个行业,帮助企业提升预测精度,优化供应链,降低库存成本,实现数据驱动的商业决策。
数据叙事Skill data-storytelling
数据叙事是一种将复杂数据分析结果转化为清晰、有说服力商业故事的技能。它通过结构化叙事框架、受众适配和可视化注释,帮助决策者理解数据洞察、制定行动方案。关键词:数据叙事、商业智能、数据分析、数据可视化、决策支持、故事讲述、商业沟通、洞察转化、执行摘要、数据驱动决策。
商业智能仪表板平台技能Skill bi-dashboards
商业智能仪表板平台技能是一个专注于自动化构建、配置和管理跨平台商业智能(BI)与营销数据可视化仪表板的专业能力。它集成了Tableau、Power BI、Looker Studio、Domo等主流BI工具,提供数据连接、自定义指标计算、报告自动化调度、多源数据混合以及可视化优化等核心功能。该技能旨在帮助企业高效创建数据驱动的决策支持系统,提升营销绩效监控、ROI分析和业务洞察的效率。关键词:商业智能BI,数据仪表板,营销数据分析,Tableau开发,Power BI报告,数据可视化,自动化报表,KPI监控。
Clari预测Skill clari-forecasting
Clari预测技能是一个与Clari收入运营平台集成的工具,专注于利用人工智能技术进行数据驱动的销售预测和收入分析。它提供AI预测、销售管道健康检查、交易活动信号监控和情景建模等功能,帮助销售团队将预测从主观判断转变为基于数据的科学决策,从而提高预测准确性、识别风险交易并优化销售策略。 关键词:Clari预测,AI销售预测,收入运营平台,销售管道分析,交易风险评估,数据驱动预测,情景建模,销售预测工具,商业智能,CRM集成
DBeaver数据库工具技能Skill dbeaver
此技能提供 DBeaver 数据库工具的全面指导,包括数据库连接、SQL 编辑、数据管理和数据库管理,帮助用户高效处理数据库操作。关键词:数据库、SQL、DBeaver、数据管理、数据库管理、SQL 查询、数据库工具、数据工程。
数据可视化分析师Skill data-visualization-analyst
数据可视化技能专注于通过引导数据清理和图表设计过程,生成具备清晰叙事框架的高质量可视化输出,旨在创建准确、准备出版的可视化以传达分析故事,支持决策制定。关键词包括数据可视化、数据分析、数据清理、图表设计、python数据可视化、数据故事。
提取技能Skill extract
提取技能是Starlake工具中的一项功能,用于从JDBC数据库源提取模式和数据。它将数据库模式的元数据提取为YAML文件,并将实际数据提取到文件中。这个技能结合了模式提取和数据提取,是一个方便的ETL命令,适用于数据工程、数据仓库和ETL开发工作流,帮助自动化数据处理任务。关键词:数据提取,数据库模式,JDBC,ETL,数据工程,数据仓库,Starlake。
表依赖关系生成器Skill table-dependencies
该技能用于根据数据库表中的外键关系,自动生成可视化表依赖图,帮助理解数据模型结构。关键词:表依赖、实体关系图、数据模型、可视化、YAML配置、数据库设计、数据工程。
仪器数据Allotrope转换器Skill bio-instrument-data
该技能用于将实验室仪器输出文件转换为标准化的Allotrope Simple Model (ASM) JSON格式或扁平化2D CSV,便于在LIMS系统、数据湖中使用或进行下游分析。它支持自动检测仪器类型,并提供ASM JSON、CSV和Python代码输出,帮助数据工程师集成到生产管道中。关键词:仪器数据转换、Allotrope标准化、LIMS系统、数据工程、生物信息学、数据湖、Python解析器。