数据科学 Skill技能列表

4.5

数据模式与知识建模Skill data-schema-knowledge-modeling

数据模式与知识建模是一种用于设计数据库模式、构建知识图谱和定义数据模型的技能。它涉及识别实体、属性和关系,指定约束和不变量,以实现正确的系统实施和数据集成。关键词包括数据库设计、数据模型、知识图谱、实体关系建模、数据治理、模式迁移和数据可视化,适用于数据工程、数据治理和架构设计等场景。

4.5

统计建模与计量经济学分析Skill statsmodels

Statsmodels 是 Python 的一个开源库,专门用于统计建模、计量经济学分析和时间序列分析。它提供了广泛的统计方法,包括线性回归、广义线性模型、逻辑回归、ARIMA 等,用于数据分析和预测。关键词:统计建模,Python,回归分析,时间序列,计量经济学,假设检验,数据分析,预测建模。

4.5

数据库-SnowflakeSkill database-snowflake

该技能用于执行Snowflake数据仓库的SQL查询、列出数据库表和检查数据模式。提供脚本工具以方便数据探索和分析,适用于数据工程和商业智能场景。关键词:Snowflake、数据仓库、SQL查询、模式检查、数据管理。

4.5

线性规划求解器Skill linear-programming-solver

线性规划求解器是一种用于解决资源分配、生产调度和商业优化问题的数学建模工具。它通过建立线性目标函数和约束条件,使用优化算法寻找最优解,广泛应用于供应链管理、投资组合优化、生产计划等领域。关键词:线性规划、优化算法、资源分配、生产调度、供应链优化、投资组合、数学建模、商业决策、敏感性分析、影子价格。

4.5

数值线性代数工具包Skill numerical-linear-algebra-toolkit

数值线性代数工具包是一个专注于高性能数学计算的技能,提供矩阵分解、特征值计算、稀疏矩阵处理和迭代求解等核心线性代数操作。适用于科学计算、工程仿真、量化金融建模和机器学习算法开发等领域,帮助用户高效解决大规模数值计算问题。关键词:数值线性代数,矩阵分解,特征值计算,稀疏矩阵,迭代求解器,科学计算,高性能计算,数学建模。

4.5

ClickHouse数据工程与分析技能Skill clickhouse-io

这个技能专注于使用ClickHouse列式数据库进行高性能数据分析和数据工程,涵盖表设计、查询优化、物化视图、批量插入和实时聚合等模式。它适用于大规模数据处理、实时OLAP分析,特别是在股票量化交易中用于数据处理、回测和风险评估,关键词包括ClickHouse、数据分析、数据工程、查询优化、物化视图、量化金融、OLAP、实时分析、大数据处理。

4.5

数据库架构设计Skill database-schema-design

本skill提供数据库架构设计的详细指导,包括规范化策略、表设计模式、约束策略、数据类型选择、架构演进和性能优化等,旨在帮助设计出可扩展、高效的数据库架构。

4.5

Dask分布式计算技能Skill dask

Dask是一个Python库,用于并行和分布式计算,支持处理超过内存限制的大数据工作流。适用于数据科学、机器学习、数据工程任务,如ETL、数据分析和大规模数值计算。关键词:分布式计算,大数据处理,Python,pandas,NumPy,并行处理,数据科学,机器学习,数据工程,ETL开发。

4.5

LaminDBSkill lamindb

LaminDB 是一个开源的生物数据管理框架,旨在使数据可查询、可追溯、可复制且符合 FAIR 原则。它支持生物数据集管理、计算工作流跟踪、数据注释与验证、生物本体集成等,适用于 scRNA-seq、空间转录组学等生物学研究。关键词:LaminDB, 生物数据管理, FAIR, 数据治理, 工作流跟踪, scRNA-seq, 数据湖。

4.5

可视化检查Skill visualization-check

可视化检查是一个用于审查数据可视化图表清晰度的技能,通过上下文无关的智能代理作为天真读者,确保图表在无额外上下文中能清晰传达核心信息。适用于R或Python绘图脚本的迭代优化,关键词包括数据可视化、图表审查、可视化最佳实践、R脚本、Python脚本和上下文无关审查。

4.5

数据建模Skill data-modeling

数据建模是设计数据库模式、数据仓库和数据分析系统的核心技能,涵盖维度建模、星型模式、数据保险库等技术,用于优化数据存储和查询性能,支持操作型和分析型数据处理。关键词:数据建模,数据库设计,数据仓库,OLAP,OLTP,维度建模,星型模式,数据保险库。

4.5

数据库查询与导出Skill database-query-and-export

这个技能用于查询SQLite、PostgreSQL和MySQL数据库,并将结果导出到CSV或JSON格式。适用于数据提取、报告生成、备份迁移、数据分析工作流和自动化数据库查询。关键词包括数据库查询、数据导出、CSV导出、JSON导出、SQLite、PostgreSQL、MySQL、数据工程、ETL。