数据科学 Skill技能列表
模式推断Skill infer-schema
这个技能用于从数据文件(如CSV、JSON、XML、Parquet)中自动推断出Starlake表的模式,并生成对应的YAML配置文件。适用于数据工程中的模式发现、元数据管理和ETL开发流程,帮助数据团队快速建立数据结构。关键词:数据模式推断,ETL开发,YAML配置,文件分析,元数据生成。
网页抓取技能Skill using-web-scraping
这个技能使用头less Chrome和DuckDuckGo进行网页抓取和搜索,专注于可靠导航、提取结构化文本、遵守robots.txt和速率限制。用于收集公开网页内容以进行摘要、元数据提取或链接发现。关键词:网页抓取、数据收集、Playwright、DuckDuckGo、自动化、数据提取、SEO优化。
SQL优化模式Skill sql-optimization-patterns
本技能提供SQL查询优化、索引策略和EXPLAIN分析的全面指南,帮助数据工程师和开发者提升数据库性能,消除慢查询。适用于数据库管理、后端开发和数据工程场景。关键词:SQL优化、数据库性能、索引策略、查询计划、EXPLAIN分析、慢查询调试。
投资组合仪表板构建器Skill portfolio-dashboard-builder
投资组合仪表板构建器是一款专为风险投资和私募股权设计的商业智能工具,用于创建可视化投资组合监控和LP报告仪表板。该工具支持生成标准化和自定义的可视化图表,包括绩效跟踪、基准对比、行业分析和热力图等,帮助投资团队有效监控基金表现,并向有限合伙人提供专业的数据可视化报告。关键词:投资组合管理、风险投资仪表板、LP报告可视化、基金绩效跟踪、商业智能BI、数据可视化工具、VC投资分析、私募股权报告。
排队系统分析器Skill queuing-analyzer
排队系统分析器是一个基于排队论的AI分析工具,用于对各类等待线系统进行数学建模和性能评估。它支持M/M/1、M/M/c、M/G/1等多种经典排队模型,能够计算系统利用率、平均等待时间、队列长度等关键性能指标,并应用于呼叫中心人员配置、服务能力规划、系统优化等场景。关键词:排队论,系统分析,性能评估,数学模型,服务优化,呼叫中心,容量规划,仿真建模。
作业技能Skill job
starlake作业技能是用于运行数据处理作业的命令行工具,作为transform命令的别名,支持运行指定作业及其递归依赖,适用于数据工程和ETL开发场景。关键词:starlake, 作业, transform, 数据处理, ETL, 命令行, 数据转换, 数据仓库, 自动化任务。
数据复制设置Skill data-replication-setup
本文档提供了数据库复制的详细指南,包括主从复制、多主复制、复制监控和故障转移等,旨在帮助实现高可用性和灾难恢复。
DatabaseSchemaDocumentationSkill database-schema-documentation
提供数据库架构文档,包括实体关系图(ERD)、表定义、索引、约束和数据字典。用于数据库架构文档、ERD创建、数据字典编写、表关系文档、索引和约束文档、迁移文档和数据库设计规范。
ESLoad技能Skill esload
这是一个用于将数据从文件(如Parquet、JSON)加载到Elasticsearch索引的工具,支持自定义映射、文档ID和时间戳索引命名,适用于数据工程和ETL流程,方便数据集成与处理。关键词:Elasticsearch, 数据加载, Parquet, JSON, 映射, 文档ID, 时间戳索引, ETL, 数据工程。
可视化选择与报告Skill visualization-choice-reporting
可视化选择与报告技能涉及根据数据和问题选择适当的图表类型,并创建叙述性报告以突出数据见解和推荐行动。它适用于数据分析、仪表板构建、商业智能和决策支持场景,帮助用户将复杂数据转化为清晰、可操作的视觉故事。关键词:数据可视化,图表选择,报告生成,数据分析,商业智能,仪表板设计,叙述性报告。
数据库模式可视化工具Skill schema-visualizer
该技能用于从数据库模式生成可视化图表、实体关系图(ERD)和文档,支持多种格式如Mermaid、PlantUML和来源如SQL、ORM模型,帮助数据库设计、分析和优化,关键词包括数据库、模式、可视化、ERD、文档、SQL、ORM。
Excel转YML转换器Skill xls2yml
Excel转YML转换器是一款将Excel表格中的域和表架构转换为Starlake YAML配置文件的工具。适用于数据工程团队,简化数据模型管理流程,支持批量文件转换、自定义输出目录、IAM策略标签集成等功能,提高数据治理效率。关键词:Excel转YML、Starlake、数据工程、配置管理、ETL开发、数据治理。