数据科学 Skill技能列表
数据分类Skill data-classification
数据分类技能提供了一个全面的框架,用于定义数据的敏感性级别、处理要求、标签和生命周期管理。它帮助组织建立数据分类政策,实施数据保护控制,并确保合规性。关键词:数据分类,数据治理,数据安全,生命周期管理,合规,访问控制,加密。
模式演进管理器Skill SchemaEvolutionManager
模式演进管理器是一款专注于数据治理的工具,用于管理数据模式的演进和兼容性。它支持Avro、Protobuf、JSON Schema等多种格式,提供破坏性变更检测、迁移脚本生成、版本管理和跨系统同步功能,确保数据系统在升级过程中的稳定性和兼容性。关键词:模式演进、数据兼容性、数据治理、迁移脚本、模式管理、数据工程、ETL、数据管道。
OBT设计优化器Skill OBTDesignOptimizer
OBT设计优化器是一款专注于数据仓库单一大表(One Big Table)模式设计与优化的专业工具。该技能通过智能分析源模型结构和查询模式,提供列选择优化、反规范化策略、分区聚类设计等核心功能,帮助用户在存储性能与查询效率之间找到最佳平衡点。适用于大数据分析、商业智能报表、数据仓库建设等场景,支持Snowflake、BigQuery、Redshift等主流云数据平台。
数据血缘关系映射器Skill data-lineage-mapper
数据血缘关系映射器是一款用于数据治理的专业工具,能够从SQL、dbt、Airflow、Spark等多种数据源中自动提取、分析和可视化数据血缘关系。它支持列级血缘追踪、上下游影响分析,并能生成兼容DataHub、OpenLineage等主流数据目录的标准化血缘图谱,帮助企业实现数据资产的透明化管理、变更影响评估和数据合规性审计。
SQL模式速查手册Skill sql-patterns
本技能提供SQL常用模式、公共表表达式(CTE)、窗口函数、JOIN类型、分页技巧、索引策略及反模式的快速参考指南。适用于数据库查询优化、数据分析、后端开发,帮助开发者编写高效SQL语句。关键词:SQL模式,CTE示例,窗口函数,SQL连接,索引策略,分页SQL,数据库优化,查询性能。
SQL查询入门Skill sql-query-starter
这个技能用于帮助初级开发者根据简单需求快速起草基本的SQL查询,包括SELECT语句、WHERE条件、ORDER BY排序、LIMIT限制和参数化查询,适用于数据库开发和数据工程场景。关键词:SQL查询、数据库开发、数据工程、参数化查询、SELECT语句、WHERE条件、ORDER BY排序、LIMIT限制。
Python回归与统计分析Skill python-regression-statistics
这个技能用于在Python中进行回归分析、统计建模和异常值检测,提供完整的统计推断和机器学习方法,包括使用statsmodels、scikit-learn等库进行模型诊断、假设检验和预测建模。适用于数据科学和人工智能项目,关键词:Python回归分析,统计建模,异常值检测,数据科学,预测建模。
Snowflake数据仓库自动化技能Skill SnowflakeAutomation
该技能用于自动化Snowflake数据仓库的操作,包括列出数据库、模式和表,执行SQL查询和DDL/DML语句,管理数据工作流。通过Composio MCP集成,实现跨应用数据管道自动化,提高数据工程和数据分析效率。关键词:Snowflake、数据仓库、自动化、SQL、数据工程、ETL、Composio、云数据库。
时间序列分析器Skill time-series-analyzer
时间序列分析器是一款专注于时间序列数据分析与预测的专业工具。它能够对历史数据进行趋势分析、季节性分解和模式识别,并运用ARIMA等统计模型进行未来值预测。该技能适用于金融预测、销售分析、需求预测、科学实验数据分析等多个领域,帮助用户从时间维度数据中提取有价值的信息并做出数据驱动的决策。关键词:时间序列分析,ARIMA模型,趋势预测,数据分析,统计建模,季节性分解,平稳性检验,预测精度评估。
蜂鸟交易机器人技能Skill hummingbot
Hummingbot蜂鸟交易机器人框架开发技能,提供算法交易、加密货币自动化交易、做市策略、套利交易、交易所API连接等功能的全面开发支持。包含官方文档翻译、代码示例、配置指南和故障排除,适用于量化交易开发者和加密货币交易系统集成。
GoogleBigQuery自动化Skill googlebigquery-automation
该技能通过 Rube MCP 自动化 Google BigQuery 任务,包括运行 SQL 查询、探索数据集和元数据、执行 MBQL 查询等,适用于数据分析和商业智能场景。关键词:Google BigQuery, Metabase, Rube MCP, SQL 查询, 数据分析, 商业智能, 自动化, 数据工程。
抓取文章Skill scrape-posts
此技能用于从Milan Jovanovic的.NET博客优化抓取新文章,通过预筛选列表页面,仅抓取新增或更新的内容,以减少API请求并提升效率。关键词:博客抓取、数据自动化、内容管理、SEO优化、网络爬虫、节省成本。