数据科学 Skill技能列表
数据清洗流程Skill DataCleaningPipeline
构建稳健的数据清洗流程,包括缺失值处理、异常值检测、数据类型标准化、重复项删除、归一化和缩放,以及文本清洗等,以确保数据的完整性和一致性,适合于数据预处理和自动化数据流水线。
DataMigrationScriptsSkill data-migration-scripts
创建安全、可逆的数据库迁移脚本,用于模式变更、数据迁移和转换,支持零停机部署。
DatabaseBackup&RestoreSkill database-backup-restore
数据库备份与恢复策略实施指南,包括备份类型、保留策略、恢复测试和RTO/RPO规划。
数据库索引策略Skill database-indexing-strategy
本技能涉及数据库索引策略的设计和实施,包括索引创建、查询性能优化、索引类型选择、复合和部分索引设计、索引维护和监控等,旨在提高数据库查询效率和数据完整性。
DatabaseMigrationsSkill DatabaseMigrations
数据库迁移是用于模式演变和数据转换的数据库迁移策略和工具,它们帮助团队以受控、可复现的方式发展数据库结构,同时维护数据完整性并最小化停机时间。
数据库管理Skill managing-databases
数据库管理技能专注于指导PostgreSQL、DuckDB、Parquet和PGVector的架构决策,用于设计数据库模式、选择存储策略、优化查询性能、调整维护配置、实施向量搜索,并诊断OLTP、OLAP和相似性搜索工作负载中的性能问题。关键词:数据库管理,PostgreSQL,DuckDB,Parquet,PGVector,架构设计,性能优化,数据工程。
PostgreSQL高级模式Skill postgres-advanced-patterns
PostgreSQL高级模式技能专注于数据库性能优化、复杂查询处理、索引策略和数据库设计。包含有效的索引创建、查询优化技巧、窗口函数、CTEs、JSON操作、分区、物化视图等高级功能。适用于后端开发人员、数据工程师和数据库管理员,提升PostgreSQL数据库的效率和可扩展性。关键词:PostgreSQL, 数据库优化, 性能调优, 查询优化, 索引策略, 数据库设计。
ClickHouse高性能分析模式与优化Skill clickhouse-io
本技能专注于 ClickHouse 数据库的高性能分析模式、查询优化和数据工程最佳实践,适用于大规模数据分析工作负载。关键词包括 ClickHouse、数据分析、查询优化、数据仓库、ETL、物化视图、性能监控、OLAP、列式存储。
数据库模式可视化工具Skill schema-visualizer
该技能用于从数据库模式生成可视化图表、实体关系图(ERD)和文档,支持多种格式如Mermaid、PlantUML和来源如SQL、ORM模型,帮助数据库设计、分析和优化,关键词包括数据库、模式、可视化、ERD、文档、SQL、ORM。
TRIPOD+AI合规检查技能Skill tripod-check
这个技能用于审计预测模型和临床AI手稿,对照TRIPOD+AI检查表进行评估,确保模型的透明报告、合规性和公平性。关键词:TRIPOD+AI, 预测模型, 临床AI, 审计, 合规检查, 机器学习, 深度学习, 透明报告, 医疗保健, 数据科学。
Scrapfly自动化Skill scrapfly-automation
该技能通过Rube MCP和Composio自动化Scrapfly网页抓取任务,提供工具发现、连接管理和执行功能,优化数据采集流程。关键词:Scrapfly自动化,Rube MCP,Composio,网页抓取,数据采集,自动化工具,数据工程。
源编码技能Skill source-coding
该技能专注于信息论中的源编码问题,提供解决策略和工具,包括霍夫曼编码、算术编码、率失真理论等,用于优化数据压缩和编码效率。关键词:源编码,信息论,数据压缩,编码理论,熵。