数据工程 Skill技能列表
网络爬虫Skill web-scraping
网络爬虫技能用于从网站提取数据,包括绕过反爬虫机制、内容提取、处理未记录API和毒丸检测。适用于数据采集、内容分析、社交媒体处理和SEO优化。关键词包括网络爬虫、数据提取、反爬虫、API爬取、毒丸检测、网页抓取、数据工程。
SQL专家Skill sql-pro
SQL专家技能提供跨主流数据库平台(PostgreSQL、MySQL、SQL Server、Oracle)的专业SQL开发、数据库设计、查询优化、性能调优和数据迁移服务。专注于复杂查询编写、执行计划分析、索引设计、存储过程开发和数据库架构优化,帮助企业提升数据处理效率与系统可扩展性。关键词:SQL开发,数据库设计,查询优化,性能调优,数据迁移,PostgreSQL,MySQL,SQL Server,Oracle,CTE,窗口函数,索引优化,执行计划分析。
数据库设计Skill database-design
数据库设计技能专注于设计高效、可扩展、可维护的数据库模式和数据模型,涵盖关系型数据库、NoSQL数据库、时间序列数据库、数据仓库和事件溯源等。关键词包括数据库设计、数据建模、OLTP、OLAP、ETL、索引优化、迁移脚本和数据管道。
知识图谱构建器Skill knowledge-graph-builder
该技能用于设计和构建知识图谱,以表示实体、关系和语义连接,支持Neo4j、RDF等图数据库的查询模式。核心能力包括图建模、查询语言(如Cypher、SPARQL)、本体设计和图算法应用,适用于知识管理、推荐系统、欺诈检测、根因分析等场景。关键词:知识图谱、图数据库、Neo4j、RDF、语义连接、图算法、Cypher、SPARQL、实体建模。
高级数据工程师Skill senior-data-engineer
高级数据工程师技能专注于构建和管理企业级数据基础设施。核心能力包括设计和实施可扩展的数据管道、ETL/ELT系统,以及高效的数据处理工作流。精通Python、SQL、Spark、Airflow、dbt、Kafka等现代数据技术栈,涵盖数据建模、管道编排、数据质量保证和DataOps实践。适用于大数据处理、数据仓库建设、AI/ML数据供给、实时数据流处理和数据治理等场景,旨在为数据驱动型业务提供可靠、高性能的数据基础。关键词:数据工程,ETL,数据管道,数据架构,大数据,Spark,Airflow,数据建模,DataOps,数据基础设施。
推特数据抓取工具Skill twscrape
twscrape 是一个强大的 Python 库,专门用于通过 GraphQL API 高效抓取 Twitter/X 数据。它支持多账户轮换、会话管理和异步操作,能有效绕过平台速率限制,适用于社交媒体监控、数据分析、舆情研究和大规模数据收集等场景。关键词:Twitter数据抓取、社交媒体爬虫、Python爬虫、账户轮换、异步数据采集、GraphQL API、数据挖掘、舆情分析。
数据建模Skill data-modeling
数据建模技能用于创建和文档化数据结构,包括实体关系图(ERD)、数据字典和概念/逻辑/物理模型。适用于数据库设计、数据架构规划,支持业务分析和系统实现。关键词:数据建模、ERD、实体关系图、数据字典、数据库设计、数据架构、数据工程。
PostgreSQL数据库专家Skill postgres-pro
PostgreSQL数据库专家技能提供全面的PostgreSQL数据库管理、性能优化、高可用性设置、备份恢复和高级功能实现的专业知识。专注于PostgreSQL性能调优、JSONB索引优化、流复制配置、分区策略和高级扩展应用,帮助企业构建高性能、高可用的PostgreSQL数据库系统。关键词:PostgreSQL数据库管理、性能优化、高可用性、备份恢复、JSONB索引、流复制、分区策略、PostGIS、pgvector、数据库调优。
数据库工程精通Skill afrexai-database-engineer
提供全面的数据库设计、优化、迁移和运维指导,包括模式设计、索引策略、查询优化、数据库迁移、性能监控、备份与恢复、安全防护等关键领域的深入分析和最佳实践。
PostgreSQL查询专家Skill postgres-query-expert
这个技能是关于PostgreSQL 16数据库的全面指南,用于构建标准和高级SQL查询、优化性能、调试错误、管理数据库模式和结构内省。适用于数据库开发人员、数据工程师和数据分析师,提升数据库操作效率和数据处理能力。关键词:PostgreSQL、SQL查询、数据库优化、数据工程、模式管理、性能调优、SQL调试。
Twitter/X数据抓取工具Skill twscrape
twscrape 是一个强大的 Python 库,专门用于高效、大规模地抓取 Twitter(现 X)平台的公开数据。它通过 GraphQL API 和账号轮换机制,支持异步并行抓取推文、用户资料、关注者列表和趋势话题等,是构建社交媒体分析、舆情监控和市场研究工具的利器。关键词:Twitter 数据抓取,X 平台爬虫,社交媒体分析,Python 异步爬虫,账号轮换,GraphQL API,数据采集。
SQL查询入门Skill sql-query-starter
这个技能用于帮助初级开发者根据简单需求快速起草基本的SQL查询,包括SELECT语句、WHERE条件、ORDER BY排序、LIMIT限制和参数化查询,适用于数据库开发和数据工程场景。关键词:SQL查询、数据库开发、数据工程、参数化查询、SELECT语句、WHERE条件、ORDER BY排序、LIMIT限制。