数据科学 Skill技能列表
PostgreSQL高级模式Skill postgres-advanced-patterns
PostgreSQL高级模式技能专注于数据库性能优化、复杂查询处理、索引策略和数据库设计。包含有效的索引创建、查询优化技巧、窗口函数、CTEs、JSON操作、分区、物化视图等高级功能。适用于后端开发人员、数据工程师和数据库管理员,提升PostgreSQL数据库的效率和可扩展性。关键词:PostgreSQL, 数据库优化, 性能调优, 查询优化, 索引策略, 数据库设计。
数据公共客户端Skill datacommons-client
这个技能提供对Data Commons平台的程序化访问,用于查询和探索公共统计数据、知识图谱和实体标识符。适用于数据科学家、分析师和开发者获取人口统计、经济指标、健康数据、环境统计等全球权威数据,进行数据分析、建模和决策支持。关键词:Data Commons、API、统计数据、知识图谱、Python、数据工程、经济指标、人口统计、健康数据。
AIOS数据库架构与运维工程师Skill aios-data-engineer
这是一个专注于数据库架构与运维的技能,用于数据库设计、模式构建、Supabase配置、RLS策略实施、数据迁移、查询优化、数据建模和运维监控。适合数据工程师、数据库管理员和开发人员使用。关键词:数据库架构、运维工程师、Supabase、数据工程、查询优化、RLS策略、数据建模、迁移。
SaaS收入增长指标分析Skill saas-revenue-growth-metrics
本技能专注于计算和解释SaaS产品的收入、留存和增长指标,包括收入、ARPU/ARPA、MRR/ARR、流失率、NRR、扩展和队列分析。用于评估SaaS业务健康、产品市场契合度,支持数据驱动的增长决策。关键词:SaaS、收入分析、留存指标、增长评估、数据驱动。
CSV数据整理专家Skill csv-data-wrangler
CSV数据整理专家是一个专注于高效处理、清洗和转换CSV文件的专业技能。它使用Python、DuckDB和命令行工具,解决大型CSV文件处理、编码问题、数据验证和格式转换等挑战。关键词:CSV处理、数据清洗、Python、DuckDB、大数据、表格数据、编码转换、数据验证、文件分块、SQL查询。
渐变维度实现生成器Skill SCDImplementationGenerator
渐变维度实现生成器是一款自动化数据建模工具,专门用于跨平台生成渐变维度(SCD)实现方案。该工具支持SCD类型1/2/3/4/6,可自动生成MERGE语句、dbt快照配置、代理键管理和历史跟踪优化代码。适用于数据仓库、ETL开发、维度建模和商业智能场景,帮助数据工程师高效实现数据历史版本管理和变更跟踪。关键词:渐变维度,SCD,数据建模,数据仓库,ETL开发,历史跟踪,维度建模,代理键,dbt,数据工程
数据迁移规划器Skill afrexai-data-migration
数据迁移规划器是一款用于系统间数据迁移的专业工具,提供完整的迁移解决方案。它涵盖数据迁移规划、模式映射、ETL管道设计、数据验证和回滚策略。支持从Salesforce到HubSpot CRM、MySQL到PostgreSQL等多种系统迁移场景。包含数据发现、模式映射、ETL流程、验证测试和切换计划五个阶段,确保数据迁移的安全可靠。适用于企业系统升级、数据仓库迁移、云迁移等场景。关键词:数据迁移,ETL管道,模式映射,数据验证,迁移规划,系统迁移,数据工程,迁移策略,数据治理,迁移操作手册
ClickHouse高性能分析模式Skill clickhouse-io
本技能文档系统介绍了ClickHouse数据库在高性能分析场景下的核心模式与实践。涵盖表设计优化、查询性能调优、数据插入策略、物化视图应用、性能监控方法以及常见分析查询模式。适用于数据工程师、数据分析师和开发人员构建实时分析系统、数据仓库和大规模数据处理平台。关键词:ClickHouse优化、OLAP数据库、实时分析、数据工程、查询性能、大数据处理、数据仓库、ETL管道、物化视图、时间序列分析。
TimescaleDB时序数据库技能Skill timescaledb
TimescaleDB时序数据库技能是专门用于PostgreSQL时间序列数据库扩展的AI助手。提供TimescaleDB开发支持、超表管理、连续聚合、数据压缩、实时分析等功能。适用于时序数据处理、物联网监控、金融数据分析、DevOps监控等场景。关键词:TimescaleDB、时序数据库、PostgreSQL扩展、超表、时间序列分析、数据压缩、实时分析、物联网数据、金融数据、DevOps监控。
DatabaseSchemaDesignerSkill database-schema-designer
这项技能提供全面的指导,用于设计健壮、可扩展的数据库架构,适用于SQL和NoSQL数据库。无论是从头开始构建还是演进现有架构,此框架确保数据完整性、性能和可维护性。
创建Bauplan数据管道Skill creating-bauplan-pipelines
本技能是Bauplan数据工程平台的详细指南,用于创建和管理数据管道项目。它涵盖了从项目初始化、DAG(有向无环图)设计、SQL/Python模型编写、到严格模式验证和物化策略的全流程。核心功能包括:数据管道开发、ETL/ELT流程构建、数据转换模型(SQL/Python)、数据质量检查、I/O下推优化、分支安全管理以及自动化工作流。适用于数据工程师、数据分析师和开发人员构建可维护、高性能的数据处理流水线。
WAP数据安全摄取技能Skill wap-ingestion
WAP数据安全摄取技能是一种基于写-审计-发布模式的数据工程解决方案,专门用于从AWS S3云存储安全导入数据到bauplan数据平台。该技能通过临时分支隔离、数据质量检查、原子性合并等机制,确保数据加载过程的安全可靠,防止脏数据污染生产环境。适用于金融风控、企业数据仓库、ETL流程、数据湖管理等场景,支持Parquet、CSV、JSONL等多种数据格式的安全摄取。