数据科学 Skill技能列表

4.5

RayData分布式数据处理Skill ray-data

Ray Data 是一个用于机器学习和人工智能工作负载的可扩展分布式数据处理库,支持流式执行、GPU加速,并集成PyTorch、TensorFlow等框架。适用于大规模数据预处理、批量推断、多模态数据加载和分布式ETL管道。关键词:分布式数据处理、机器学习、AI、流式执行、GPU加速、ETL、Ray、数据预处理、批量推断。

4.5

Excel作业定义转YAML技能Skill xls2ymljob

这是一个用于数据工程的工具,能够将Excel电子表格中描述的任务定义高效转换为Starlake YAML配置文件,支持批量处理和策略集成,适用于ETL开发和数据治理。关键词:Excel, YAML, Starlake, 任务转换, ETL开发, 数据工程, 数据治理, 配置文件。

4.5

分布拟合器Skill distribution-fitter

分布拟合器是一个用于仿真和分析中输入建模的AI技能。它通过统计分布拟合、参数估计和拟合优度检验,帮助用户为离散事件仿真、排队系统分析、需求预测等场景找到最能代表观测数据的概率分布模型。核心功能包括自动化分布拟合、最大似然估计、到达间隔时间分析、经验分布构建和分布比较。关键词:统计分布拟合,输入建模,仿真分析,最大似然估计,拟合优度检验,概率分布,数据分析,量化金融,Python scipy。

4.5

Kafka数据加载技能Skill kafkaload

Kafka 数据加载技能是一个用于在 Apache Kafka 主题和文件系统之间高效传输数据的工具。它支持批处理和流式处理模式,提供数据转换功能,适用于数据集成、ETL 流程和大数据处理场景。关键词:Kafka、数据加载、数据卸载、批处理、流式处理、数据转换、ETL。

4.5

数据完整性守护者Skill data-integrity-guardian

数据完整性守护者是一种专注于数据库迁移安全、数据约束验证、事务边界审查、引用完整性保护和隐私合规的技能。用于确保数据库操作的可靠性,防止数据丢失和腐败,维护数据治理标准。关键词:数据完整性、数据库迁移、数据治理、ACID属性、GDPR合规、数据安全、事务管理、引用完整性、隐私保护。

4.5

可视化解释器Skill visual-explainer

这个技能用于生成自包含的 HTML 页面,以可视化方式解释系统、数据故事、调查、编辑工作流程和代码变更。它自动将表格和图表渲染为 HTML,支持多种设计美学,并确保可访问性和响应式设计。适用于新闻、学术和技术文档场景。关键词:HTML可视化、数据可视化、系统架构图、新闻编辑室设计、SEO优化、前端开发、数据故事、图表生成。

4.5

Navicat数据库管理技能Skill navicat

此技能提供Navicat数据库管理工具的全面指导,帮助用户进行数据库连接、SQL查询执行、数据管理和数据库管理操作,适用于数据库管理员和开发者。关键词:Navicat, 数据库管理, SQL查询, 数据管理, 数据库连接。

4.5

图表生成器Skill chart-generator

图表生成技能用于从数据创建各种类型的图表和可视化,支持多种图表库和格式(如Matplotlib、Seaborn、Chart.js、Plotly),适用于数据分析和可视化任务,关键词包括数据可视化、图表生成、数据分析、Python图表、交互式可视化。

4.5

数据架构Skill architecting-data

数据架构技能提供设计现代云原生数据平台的战略指导,涵盖存储范式选择、数据建模方法、数据网格实施、开放表格式应用等。关键词:数据架构、数据平台、存储范式、数据建模、数据网格、数据治理、现代数据堆栈、奖章架构、Apache Iceberg、dbt、数据工程。

4.5

创业指标框架Skill startup-metrics-framework

这个技能用于帮助用户理解和应用初创企业的关键绩效指标,包括MRR、CAC、LTV、单位经济、烧钱倍数、规则40、市场平台指标等,提供计算、跟踪和优化指南,适用于SaaS、市场平台、B2B等不同业务模型和从种子轮到A轮融资等阶段。关键词:创业指标、SaaS指标、单位经济、LTV:CAC、规则40、商业智能、数据追踪、初创公司、融资指标。

4.5

验证技能Skill validate

验证技能用于验证Starlake项目配置的YAML文件语法、模式合规性、连接引用等,确保在运行时前捕获配置错误,提升数据治理和ETL流程的可靠性。关键词:验证、配置管理、YAML语法、Starlake工具、数据治理、ETL开发、错误预防。

4.5

架构探索技能Skill schema-exploration

这个技能用于探索和理解数据库结构,包括列出表、获取列信息、映射表关系等,帮助数据分析师、数据库管理员和开发者优化数据查询和管理。关键词:数据库探索、架构分析、SQL工具、数据工程、数据可视化。