数据科学 Skill技能列表

4.5

Snowflake数据仓库自动化技能Skill SnowflakeAutomation

该技能用于自动化Snowflake数据仓库的操作,包括列出数据库、模式和表,执行SQL查询和DDL/DML语句,管理数据工作流。通过Composio MCP集成,实现跨应用数据管道自动化,提高数据工程和数据分析效率。关键词:Snowflake、数据仓库、自动化、SQL、数据工程、ETL、Composio、云数据库。

4.5

X社交媒体数据分析报告生成器Skill x-report-generator

X社交媒体数据分析报告生成器是一款基于Playwright浏览器自动化技术的专业工具,专门用于爬取X平台(原Twitter)的真实数据,进行深度数据统计分析,并自动生成精美的可视化HTML报告,支持导出为高清图片。该工具适用于社交媒体数据分析、竞品监测、舆情分析、营销效果评估等场景,提供关键词搜索、用户分析、情感分析、热门标签统计等核心功能。

4.5

列级血缘技能Skill col-lineage

这个技能用于生成SQL转换任务中的列级血缘,追踪输出列到源列的数据来源,提供精细的数据溯源信息。关键词:数据血缘、SQL分析、数据工程、数据治理、ETL、数据仓库。

4.5

验证技能Skill validate

验证技能用于验证Starlake项目配置的YAML文件语法、模式合规性、连接引用等,确保在运行时前捕获配置错误,提升数据治理和ETL流程的可靠性。关键词:验证、配置管理、YAML语法、Starlake工具、数据治理、ETL开发、错误预防。

4.5

YML到DDL技能Skill yml2ddl

yml2ddl技能是一个数据工程工具,用于从Starlake YAML定义自动生成SQL DDL(数据定义语言)语句,支持BigQuery、Snowflake、PostgreSQL等多种目标数据仓库。它通过类型映射简化数据库表结构的创建和管理,提升数据管道开发效率,适用于数据仓库建设和数据治理场景。关键词:SQL DDL, YAML, 数据仓库, 数据工程, 数据库管理, ETL开发, Starlake。

4.5

GreatExpectations数据质量验证器Skill great-expectations-validator

Great Expectations 数据质量验证器是一个专业的数据治理工具,用于自动化数据质量检查、模式验证和期望测试。它支持创建期望套件、生成数据文档、集成机器学习管道,并提供全面的数据质量监控解决方案。关键词:数据质量验证、Great Expectations、期望套件、数据治理、机器学习管道、自动化测试、数据文档、ETL验证、数据工程、数据科学工具。

4.5

数据架构Skill architecting-data

数据架构技能提供设计现代云原生数据平台的战略指导,涵盖存储范式选择、数据建模方法、数据网格实施、开放表格式应用等。关键词:数据架构、数据平台、存储范式、数据建模、数据网格、数据治理、现代数据堆栈、奖章架构、Apache Iceberg、dbt、数据工程。

4.5

Firecrawl抓取技能Skill firecrawl-scrape

Firecrawl抓取技能是一个通过Firecrawl MCP工具抓取网页并提取内容的技能,支持从URL或搜索查询获取结构化数据,适用于数据采集和网络内容分析,关键词包括:网页抓取、数据提取、Firecrawl、MCP、爬虫、内容抓取、SEO搜索。

4.5

PostgreSQL数据库专家Skill postgres-pro

PostgreSQL数据库专家技能提供全面的PostgreSQL数据库管理、性能优化、高可用性设置、备份恢复和高级功能实现的专业知识。专注于PostgreSQL性能调优、JSONB索引优化、流复制配置、分区策略和高级扩展应用,帮助企业构建高性能、高可用的PostgreSQL数据库系统。关键词:PostgreSQL数据库管理、性能优化、高可用性、备份恢复、JSONB索引、流复制、分区策略、PostGIS、pgvector、数据库调优。

4.5

CognitiveTwinSkill cognitive-twin

Cognitive Twin是一个始终开启的商业健康监控系统,能够持续跟踪13个商业领域,计算特定领域的健康得分,检测异常和趋势,并提供早期预警信号,帮助企业及时了解业务状况并做出决策。

4.5

时间序列预测器Skill time-series-forecaster

时间序列预测器是一个用于业务指标预测和需求规划的AI技能工具。它整合了经典统计方法(如ARIMA、ETS)、机器学习(如XGBoost、LightGBM)和深度学习(如Prophet、N-BEATS)等多种模型,支持自动模型选择、集成预测、不确定性量化和季节性分解。该技能适用于销售预测、库存管理、财务规划等商业场景,帮助企业进行数据驱动的决策。关键词:时间序列预测,业务指标预测,需求规划,ARIMA,Prophet,机器学习预测,深度学习预测,季节性分析,预测区间,商业智能。

4.5

生物信息学分析师Skill bio-informatics-analyst

该技能用于协调和管理生物信息学数据处理流程,包括数据转换、分析管道设置、质量控制以及报告生成,确保工作流程的可重复性和高效性,特别适用于单细胞分析等生物医学研究领域。关键词:生物信息学、数据分析、数据处理、工作流程自动化、可重复性、Nextflow、Python、单细胞分析、质量控制、生物医药。