数据科学 Skill技能列表

4.5

SQL查询优化编写Skill data-write-query

这个技能用于根据自然语言描述,编写针对特定SQL方言优化的查询,遵循最佳实践。它帮助用户高效进行数据提取和分析,提升数据库查询性能。关键词:SQL查询,数据编写,优化,数据分析,数据库,数据工程,ETL开发。

4.5

数据协调器技能Skill data-orchestrator

数据协调器技能负责管理和协调数据管道任务,包括ETL/ELT流程、数据验证、质量保证、管道监控等,确保数据质量标准达标,并进行特征工程和分析协调。

4.5

color-accessibilitySkill color-accessibility

设计可访问的颜色调色板,确保包括色盲用户在内的所有用户都能访问和理解信息。

4.5

数据库索引策略Skill database-indexing-strategy

本技能涉及数据库索引策略的设计和实施,包括索引创建、查询性能优化、索引类型选择、复合和部分索引设计、索引维护和监控等,旨在提高数据库查询效率和数据完整性。

4.5

Seaborn统计可视化Skill seaborn

Seaborn 是一个用于创建高质量统计图形的 Python 数据可视化库,支持散点图、箱线图、热力图等多种图表类型,适用于数据探索、分析和出版物制作。关键词:Python 可视化、统计图形、数据分析、数据探索、Seaborn 库、数据可视化工具。

4.5

RSS聚合器Skill rss-aggregator

RSS聚合器技能,通过Python脚本自动抓取和汇总多个RSS订阅源的最新内容,提供结构化更新信息,适用于信息聚合、数据分析和自动化报告。关键词:RSS聚合、数据抓取、信息汇总、自动化更新、Python脚本。

4.5

JSON画布技能Skill json-canvas

JSON画布技能用于创建和编辑符合JSON Canvas Spec 1.0的画布文件(.canvas),支持文本、文件、链接和组节点,以及边连接,适用于思维导图、流程图、项目看板等可视化场景。关键词包括JSON画布、可视化、思维导图、流程图、Obsidian、文件格式、数据可视化。

4.5

CDC模式实施器Skill CDCPatternImplementer

CDC 模式实施器是一个专注于变更数据捕获(CDC)的专业技能,用于实现实时数据集成。它提供在多种数据库和流式平台(如PostgreSQL、MySQL、Kafka)上配置和实施CDC解决方案的专家能力,包括连接器配置、模式选择、快照策略、模式变更处理和监控设置。关键词:变更数据捕获,CDC,实时数据集成,Debezium,Kafka,数据同步,ETL,流式处理,数据管道。

4.5

数据库管理Skill managing-databases

数据库管理技能专注于指导PostgreSQL、DuckDB、Parquet和PGVector的架构决策,用于设计数据库模式、选择存储策略、优化查询性能、调整维护配置、实施向量搜索,并诊断OLTP、OLAP和相似性搜索工作负载中的性能问题。关键词:数据库管理,PostgreSQL,DuckDB,Parquet,PGVector,架构设计,性能优化,数据工程。

4.5

数据分析工程Skill data-analytics-engineering

数据分析工程是一种技能,专注于构建可靠的数据指标和准备商业智能(BI)系统。它涉及定义指标和维度模型、构建数据转换层、实施数据质量测试、以及文档化数据集和数据血统。适用于需要数据建模、指标定义或分析数据处理的场景。关键词:数据分析工程、数据建模、指标定义、数据质量、BI准备、dbt、SQL转换。

4.5

数据公共客户端Skill datacommons-client

这个技能提供对Data Commons平台的程序化访问,用于查询和探索公共统计数据、知识图谱和实体标识符。适用于数据科学家、分析师和开发者获取人口统计、经济指标、健康数据、环境统计等全球权威数据,进行数据分析、建模和决策支持。关键词:Data Commons、API、统计数据、知识图谱、Python、数据工程、经济指标、人口统计、健康数据。

4.5

AIOS数据库架构与运维工程师Skill aios-data-engineer

这是一个专注于数据库架构与运维的技能,用于数据库设计、模式构建、Supabase配置、RLS策略实施、数据迁移、查询优化、数据建模和运维监控。适合数据工程师、数据库管理员和开发人员使用。关键词:数据库架构、运维工程师、Supabase、数据工程、查询优化、RLS策略、数据建模、迁移。