数据科学 Skill技能列表

4.5

预加载技能Skill preload

该技能用于在数据加载流程中检查landing或pending区域的文件可用性,确保文件就绪后触发加载,适用于数据工程、ETL开发和自动化编排,关键词:文件检查、数据加载、编排、ETL、数据仓库、预加载。

4.5

数据流设计Skill data-flow

数据流设计技能用于根据需求描述设计和实施数据管道架构,包括数据源集成、转换处理、目标系统部署,支持批处理、流处理、Lambda、Kappa等多种模式,适用于数据仓库、数据湖、机器学习、商业智能等应用场景。关键词:数据管道、ETL、流处理、数据架构、数据工程、Spark、Flink、Kafka、数据湖仓。

4.5

KPIDashboardDesignSkill kpi-dashboard-design

设计和构建跟踪关键绩效指标的仪表盘。选择相关指标,有效可视化数据,并与利益相关者沟通洞察。

4.5

RevenueOperationsSkill revenue-operations

分析销售管道覆盖率,跟踪预测准确性与MAPE,并计算GTM效率指标,以优化SaaS收入

4.5

创业趋势预测Skill startup-trend-prediction

这个技能提供系统化框架,通过分析2-3年的历史信号来预测未来1-2年的市场、技术或业务模型趋势。它结合采用曲线、周期模式和信号分析,评估市场进入时机(如进入/等待/避免),支持决策制定,包括趋势轨迹(上升/峰值/下降)、采用阶段识别等。关键词:趋势预测、市场分析、创业时机、数据驱动决策、采用曲线、市场进入、周期模式、信号分析。

4.5

AI-ML数据科学工程套件Skill ai-ml-data-science

这个技能提供了一个完整的端到端数据科学和机器学习工程工作流程,将原始数据和业务问题转化为可生产化的验证模型。它涵盖了数据探索、特征设计、模型选择、性能评估、SQL变换和MLOps实践,特别强调现代特征存储、自动化重训练和漂移监控。关键词:数据科学、机器学习、特征工程、模型评估、MLOps、SQLMesh、预测建模、可重复性。

4.5

时间序列数据库技术Skill using-timeseries-databases

时间序列数据库技术用于高效存储和查询时间戳数据,如金融交易数据、物联网传感器、监控指标和日志。该技能涉及数据库选择(包括TimescaleDB、InfluxDB、ClickHouse、QuestDB)、连续聚合、降采样(LTTB算法)和保留策略优化,适用于构建实时仪表板、监控系统、物联网平台和金融应用。关键词:时间序列数据库、数据存储、查询优化、数据库技术、降采样、连续聚合。

4.5

SQL查询写作技能Skill query-writing

此技能专注于SQL查询的编写和执行,覆盖从基础单表查询到高级多表JOIN和聚合操作,适用于数据分析、数据工程和数据库管理领域,关键词:SQL查询、数据分析、数据库、数据工程、商业智能。

4.5

数据完整性守护者Skill data-integrity-guardian

数据完整性守护者是一个专注于数据库迁移安全、数据完整性验证和隐私合规的技能。它用于审查数据库迁移、验证数据约束、确保事务完整性和隐私要求合规,以保护数据免于丢失或损坏。关键词:数据库安全,数据迁移,完整性检查,隐私合规,数据治理,ACID属性。

4.5

PredictItSkill predictit

这个技能提供PredictIt政治预测市场的只读API集成,允许用户搜索市场、查看详细信息和价格数据。适用于量化金融策略开发、数据分析和预测建模。关键词:PredictIt、预测市场、政治市场、API集成、只读访问、量化金融、数据分析。

4.5

Metaculus预测平台集成Skill metaculus

此技能集成Metaculus社区预测平台,允许用户搜索预测问题、查看详细预测概率、参与预测比赛等,适用于概率分析和预测建模。关键词:预测平台、社区预测、概率分析、预测建模、Metaculus。

4.5

LaminDBSkill lamindb

LaminDB 是一个开源的生物数据管理框架,旨在使数据可查询、可追溯、可复制且符合 FAIR 原则。它支持生物数据集管理、计算工作流跟踪、数据注释与验证、生物本体集成等,适用于 scRNA-seq、空间转录组学等生物学研究。关键词:LaminDB, 生物数据管理, FAIR, 数据治理, 工作流跟踪, scRNA-seq, 数据湖。