数据科学 Skill技能列表

4.5

数据库分片Skill database-sharding

这项技能涉及数据库的水平扩展,包括分片策略、一致性哈希、分片键选择和跨分片查询模式等关键技术,用于解决大型数据库的扩展性和性能问题。

4.5

DatabaseMigrationsSkill DatabaseMigrations

数据库迁移是用于模式演变和数据转换的数据库迁移策略和工具,它们帮助团队以受控、可复现的方式发展数据库结构,同时维护数据完整性并最小化停机时间。

4.5

数据库管理Skill managing-databases

数据库管理技能专注于指导PostgreSQL、DuckDB、Parquet和PGVector的架构决策,用于设计数据库模式、选择存储策略、优化查询性能、调整维护配置、实施向量搜索,并诊断OLTP、OLAP和相似性搜索工作负载中的性能问题。关键词:数据库管理,PostgreSQL,DuckDB,Parquet,PGVector,架构设计,性能优化,数据工程。

4.5

数据管道架构师Skill data-pipeline-architect

数据管道架构师技能专注于设计和实现高效、可靠的数据管道,涵盖ETL/ELT流程、编排工具、错误处理和数据质量验证,确保数据从源到目标的顺畅流动。关键词:数据管道、ETL、ELT、数据工程、架构设计、数据质量、编排、数据仓库。

4.5

ClickHouse高性能分析模式与优化Skill clickhouse-io

本技能专注于 ClickHouse 数据库的高性能分析模式、查询优化和数据工程最佳实践,适用于大规模数据分析工作负载。关键词包括 ClickHouse、数据分析、查询优化、数据仓库、ETL、物化视图、性能监控、OLAP、列式存储。

4.5

TRIPOD+AI合规检查技能Skill tripod-check

这个技能用于审计预测模型和临床AI手稿,对照TRIPOD+AI检查表进行评估,确保模型的透明报告、合规性和公平性。关键词:TRIPOD+AI, 预测模型, 临床AI, 审计, 合规检查, 机器学习, 深度学习, 透明报告, 医疗保健, 数据科学。

4.5

Scrapfly自动化Skill scrapfly-automation

该技能通过Rube MCP和Composio自动化Scrapfly网页抓取任务,提供工具发现、连接管理和执行功能,优化数据采集流程。关键词:Scrapfly自动化,Rube MCP,Composio,网页抓取,数据采集,自动化工具,数据工程。

4.5

源编码技能Skill source-coding

该技能专注于信息论中的源编码问题,提供解决策略和工具,包括霍夫曼编码、算术编码、率失真理论等,用于优化数据压缩和编码效率。关键词:源编码,信息论,数据压缩,编码理论,熵。

4.5

Seaborn统计可视化Skill seaborn

Seaborn 是一个用于创建高质量统计图形的 Python 数据可视化库,支持散点图、箱线图、热力图等多种图表类型,适用于数据探索、分析和出版物制作。关键词:Python 可视化、统计图形、数据分析、数据探索、Seaborn 库、数据可视化工具。

4.5

ASCII迷你图表Skill ascii-mini-charts

ASCII迷你图表技能用于生成简单的ASCII图表,如火花线、柱状图和折线图,帮助用户在命令行或纯文本界面中快速可视化数据趋势。支持自定义宽度、高度和归一化,并提供压缩策略处理长数据系列。适用于数据检查、趋势分析和轻量级数据可视化场景。关键词:ASCII图表、数据可视化、趋势分析、火花线、迷你图表、归一化、压缩策略。