数据科学 Skill技能列表

4.5

数据库设计Skill database-design

数据库设计技能专注于设计高效、可扩展、可维护的数据库模式和数据模型,涵盖关系型数据库、NoSQL数据库、时间序列数据库、数据仓库和事件溯源等。关键词包括数据库设计、数据建模、OLTP、OLAP、ETL、索引优化、迁移脚本和数据管道。

4.5

数据血缘关系映射器Skill data-lineage-mapper

数据血缘关系映射器是一款用于数据治理的专业工具,能够从SQL、dbt、Airflow、Spark等多种数据源中自动提取、分析和可视化数据血缘关系。它支持列级血缘追踪、上下游影响分析,并能生成兼容DataHub、OpenLineage等主流数据目录的标准化血缘图谱,帮助企业实现数据资产的透明化管理、变更影响评估和数据合规性审计。

4.5

年度报告生成器Skill afrexai-annual-report

年度报告生成器是一款AI驱动的商业报告自动化工具,专为企业财务分析、运营评估和战略规划设计。它能将原始财务数据、客户指标、团队数据和关键里程碑自动转化为结构完整、董事会级别的年度商业报告。核心功能包括财务摘要生成、运营指标分析、战略亮点提炼和前瞻性指引制定。适用于初创公司、成长型企业及需要高效生成专业年报的财务团队、管理者和投资者。关键词:年度报告生成,财务分析自动化,商业智能报告,AI报告工具,企业绩效评估,战略规划文档,董事会报告模板,数据驱动决策。

4.5

SQL查询优化器Skill sql-query-optimizer

SQL查询优化器是一款专注于提升数据仓库查询性能的智能工具。它能够跨Snowflake、BigQuery、Redshift、Databricks等主流数据平台,自动分析SQL语句,识别性能瓶颈和反模式,并提供针对性的优化建议。核心功能包括执行计划解析、索引/聚类键推荐、连接优化、子查询重写、CTE优化等。适用于数据分析师、数据工程师和数据库管理员,旨在降低查询延迟、减少计算成本、提升数据处理效率。关键词:SQL优化、数据仓库、查询性能、Snowflake、BigQuery、Redshift、Databricks、执行计划、索引推荐、反模式检测。

4.5

CSV数据可视化器Skill csv-data-visualizer

CSV数据可视化器是一款强大的Python工具集,专为数据科学家、分析师和开发者设计,用于对CSV格式的数据进行深度探索、分析和可视化呈现。核心功能包括:1. 利用Plotly库创建交互式图表(如直方图、散点图、箱线图、热力图等);2. 自动数据剖析,生成包含统计摘要、数据质量检查和分布分析的详细报告;3. 一键生成或自定义配置多图表仪表板。该工具旨在简化从数据加载、质量评估到可视化洞察的完整工作流,支持HTML、PNG、PDF等多种输出格式,是进行探索性数据分析(EDA)、制作数据报告和构建数据看板的理想选择。 关键词:CSV数据分析,数据可视化,Plotly图表,探索性数据分析EDA,数据剖析,统计报告,交互式仪表板,Python数据分析工具,数据质量检查,自动化数据洞察。

4.5

高级数据工程师Skill senior-data-engineer

高级数据工程师技能专注于构建和管理企业级数据基础设施。核心能力包括设计和实施可扩展的数据管道、ETL/ELT系统,以及高效的数据处理工作流。精通Python、SQL、Spark、Airflow、dbt、Kafka等现代数据技术栈,涵盖数据建模、管道编排、数据质量保证和DataOps实践。适用于大数据处理、数据仓库建设、AI/ML数据供给、实时数据流处理和数据治理等场景,旨在为数据驱动型业务提供可靠、高性能的数据基础。关键词:数据工程,ETL,数据管道,数据架构,大数据,Spark,Airflow,数据建模,DataOps,数据基础设施。

4.5

财务分析师Skill financial-analyst

财务分析师技能是一套生产就绪的财务分析工具包,专为具有3-6年经验的财务分析师设计,他们执行财务建模、预测和预算编制、管理报告、业务绩效分析和投资分析。该技能包括比率分析、DCF估值、预算差异分析和滚动预测构建,以进行战略决策。

4.5

数据建模Skill data-modeling

数据建模技能用于创建和文档化数据结构,包括实体关系图(ERD)、数据字典和概念/逻辑/物理模型。适用于数据库设计、数据架构规划,支持业务分析和系统实现。关键词:数据建模、ERD、实体关系图、数据字典、数据库设计、数据架构、数据工程。

4.5

数据可视化Skill data-visualization

这个技能专注于数据可视化,用于创建清晰有效的图表、图形等数据展示,帮助理解和传达数据洞察。它涵盖图表选择指南、设计规则、颜色理论、注释技巧和讲故事方法,适用于图表、仪表板、报告、演示等场景。关键词:数据可视化,图表设计,数据故事,数据分析,商业智能,图表制作,数据图形。

4.5

数据故事讲述分析师Skill data-storytelling-analyst

数据故事讲述分析师是将原始数据转化为引人入胜的可视化叙事,利用Python或R工具,专注于数据清晰度、洞察力挖掘和美学呈现的专业技能。适用于数据分析、数据可视化、商业智能、叙事设计和信息设计等领域,关键词包括:数据可视化、故事讲述、Python数据分析、R编程、探索性数据分析(EDA)、图表美学、SEO叙事洞察。

4.5

加密货币数据流Skill cryptofeed

Cryptofeed是一个用于实时加密货币市场数据处理的Python库,支持40多家交易所的WebSocket流式传输,提供标准化数据、订单簿、交易和行情信息。适用于算法交易、量化金融、市场数据分析、套利策略开发、多交易所监控和实时数据处理。关键词:加密货币数据流、Python量化交易、WebSocket实时数据、交易所API集成、算法交易系统、市场数据分析、订单簿处理、套利策略、多交易所聚合、区块链金融数据。

4.5

数据验证Skill data-validation

数据验证技能用于在分享数据分析结果前进行全面的质量保证,包括方法论检查、准确性验证和偏见检测。它涵盖数据质量检查、计算逻辑验证、结果合理性审查以及文档标准化,确保分析的可重复性、可靠性和透明度。关键词:数据验证、质量保证、数据分析、偏见检测、可重复性、数据治理、准确性验证。