数据科学 Skill技能列表

4.5

流数据处理Skill streaming-data

这个技能用于构建事件流系统和实时数据管道,涵盖消息代理(如Kafka、Pulsar)、流处理器(如Flink、Spark)、生产者/消费者模式、事件溯源和变更数据捕获(CDC)等。适用于微服务通信、实时分析、数据集成、IoT平台和高频交易系统等场景。关键词:流数据处理、实时数据管道、事件驱动架构、Kafka、Flink、数据工程、微服务、CDC、事件溯源。

4.5

EVMDEX交易Skill trading-evm

EVM DEX交易技能允许用户在以太坊、Arbitrum、Optimism、Base和Polygon等EVM兼容链上使用Uniswap V3和1inch聚合器进行代币交易,支持MEV保护和滑点容忍度设置,适用于量化金融和加密货币交易领域。

4.5

Parquet转CSV工具Skill parquet2csv

这个技能用于将Parquet格式的数据文件转换为CSV格式,实现数据格式转换和导出功能。适用于数据工程、ETL处理和数据兼容性场景。关键词:Parquet, CSV, 数据转换, Spark, 数据导出, 格式转换, 数据工程。

4.5

数据库技能Skill databases

该技能专注于MongoDB和PostgreSQL数据库的管理与操作,涵盖数据建模、查询编写、性能优化、索引管理、数据库迁移、备份恢复策略等关键方面。适用于数据库管理员、后端开发者和数据工程师,提升数据库处理效率和系统稳定性。关键词:MongoDB, PostgreSQL, 数据库管理, 查询优化, 数据建模, 性能调优

4.5

scikit-survival生存分析技能Skill scikit-survival

scikit-survival 是一个用于生存分析和时间到事件建模的 Python 工具包。它适用于处理截尾数据、拟合 Cox 模型、随机生存森林、梯度提升模型或生存 SVM,使用一致性指数或 Brier 分数评估预测,处理竞争风险,或实现任何生存分析工作流。关键词:生存分析,时间到事件建模,截尾数据,Cox 模型,随机生存森林,梯度提升,生存 SVM,一致性指数,Brier 分数,竞争风险,Python 库,预测建模。

4.5

市场索引APISkill market-index

这个技能是一个市场索引工具,用于搜索、发现和浏览跨多个预测市场平台的市场数据。它支持关键词搜索、平台过滤、分类浏览、新市场发现和趋势分析,适用于量化金融、数据分析和市场研究。关键词:市场索引、预测市场、API、搜索、数据检索、量化交易。

4.5

SQL查询写作技能Skill query-writing

此技能专注于SQL查询的编写和执行,覆盖从基础单表查询到高级多表JOIN和聚合操作,适用于数据分析、数据工程和数据库管理领域,关键词:SQL查询、数据分析、数据库、数据工程、商业智能。

4.5

ParaView科学可视化器Skill paraview-scientific-visualizer

ParaView科学可视化器是一款专为三维科学数据渲染与分析设计的技能工具,支持VTK格式处理、体渲染、等值面提取、流线可视化、动画生成及Python脚本自动化。适用于科研数据分析、工程仿真可视化、医学影像处理等领域,帮助用户高效实现复杂科学数据的交互式可视化与洞察。关键词:ParaView可视化,三维科学数据,体渲染,等值面,流线动画,VTK数据处理,科研绘图,仿真可视化。

4.5

生物信息学分析师Skill bio-informatics-analyst

该技能用于协调和管理生物信息学数据处理流程,包括数据转换、分析管道设置、质量控制以及报告生成,确保工作流程的可重复性和高效性,特别适用于单细胞分析等生物医学研究领域。关键词:生物信息学、数据分析、数据处理、工作流程自动化、可重复性、Nextflow、Python、单细胞分析、质量控制、生物医药。

4.5

DAG生成技能Skill dag-generate

该技能用于从 Starlake 项目配置自动生成 Airflow 或 Dagster 的 DAG(有向无环图)文件,支持数据加载和变换任务的编排,适用于数据工程、ETL 开发和自动化工作流管理。关键词:DAG, Airflow, Dagster, Starlake, 数据工程, ETL, 任务编排, 工作流。

4.5

CognitiveTwinSkill cognitive-twin

Cognitive Twin是一个始终开启的商业健康监控系统,能够持续跟踪13个商业领域,计算特定领域的健康得分,检测异常和趋势,并提供早期预警信号,帮助企业及时了解业务状况并做出决策。

4.5

高级数据工程师Skill senior-data-engineer

高级数据工程师技能专注于构建和管理可扩展的数据基础设施、ETL/ELT系统、数据管道和数据质量,支持生产级AI/ML和数据系统。关键技术包括Python、SQL、Spark、Airflow、dbt、Kafka等,适用于数据架构设计、数据工作流优化、数据治理等场景,助力企业实现数据驱动的决策和创新。关键词:数据工程、ETL、数据管道、数据基础设施、Spark、Airflow、Python、SQL、DataOps。