数据科学 Skill技能列表
ETL/ELT数据管道模式Skill etl-elt-patterns
本技能详细介绍了ETL和ELT数据管道模式,包括设计、实施、优化和数据质量控制,适用于数据工程和数据分析,关键词包括ETL、ELT、数据管道、数据转换、数据仓库、数据质量、现代数据栈。
离散事件仿真器Skill discrete-event-simulator
离散事件仿真器是一种基于Python SimPy框架的专业仿真技能,用于对复杂系统进行建模、分析和优化。该技能支持随机过程建模、资源容量规划、队列管理、预热期检测和统计输出分析,广泛应用于制造系统、服务系统、供应链和业务流程的仿真优化。关键词:离散事件仿真、SimPy、随机过程建模、系统优化、置信区间分析、制造仿真、队列系统、资源规划、Python仿真、蒙特卡洛模拟。
数据新鲜度检查技能Skill freshness
这个技能用于监控数据表的新鲜度,通过查询最后更新时间戳,并将结果存储在审计表中进行监控和报警。适用于数据治理、数据工程和云服务等领域。关键词:数据新鲜度、更新时间戳、数据监控、数据报警、数据治理、Starlake、ETL、数据仓库。
模式演进管理器Skill SchemaEvolutionManager
模式演进管理器是一款专注于数据治理的工具,用于管理数据模式的演进和兼容性。它支持Avro、Protobuf、JSON Schema等多种格式,提供破坏性变更检测、迁移脚本生成、版本管理和跨系统同步功能,确保数据系统在升级过程中的稳定性和兼容性。关键词:模式演进、数据兼容性、数据治理、迁移脚本、模式管理、数据工程、ETL、数据管道。
数据治理检查Skill data-governance-check
数据治理检查技能用于审查数据处理的隐私和保留,确保合规性和风险管理。关键词:数据治理、隐私保护、数据保留、合规性、风险控制、审计、数据分类、访问路径。
文化审查技能Skill cultural-review
文化审查技能是一个专注于评估软件代码、功能特性与内容是否符合文化敏感性及原住民数据主权OCAP框架(所有权、控制权、访问权、持有权)合规性的专业指南。它提供详细的检查清单、敏感度分级标准、审批工作流程和风险标识,帮助开发者和组织在涉及原住民知识、故事和数据的项目中,确保技术实现尊重文化传统、保护数据主权并满足伦理要求。关键词:文化审查,原住民数据主权,OCAP框架,文化敏感性,数据伦理,合规检查,软件开发伦理,数据治理,原住民知识保护。
特殊函数库Skill special-functions-library
特殊函数库是一个专注于数学特殊函数计算与分析的技能工具,提供贝塞尔函数、超几何函数、椭圆函数、正交多项式(如勒让德、切比雪夫、埃尔米特)、伽马函数、贝塔函数、泽塔函数等高级数学函数的评估、操作和渐近分析能力。支持高精度数值计算、恒等式变换和连接公式应用,适用于科学计算、工程分析、量化金融建模等需要复杂数学函数处理的场景。
RingLead数据去重Skill ringlead-dedup
RingLead 数据去重技能是一个专注于企业CRM数据治理的自动化工具。它通过智能算法实现重复记录检测与合并、数据标准化清洗、以及线索与客户账户的精准匹配。核心功能包括模糊匹配、数据质量评分、自动合并规则执行,旨在提升销售数据完整性、优化线索分配流程并增强客户关系管理效率。关键词:CRM数据去重,数据质量平台,线索匹配,数据清洗,RingLead集成,销售自动化,数据治理。
PostgreSQL查询专家Skill postgres-query-expert
这个技能是关于PostgreSQL 16数据库的全面指南,用于构建标准和高级SQL查询、优化性能、调试错误、管理数据库模式和结构内省。适用于数据库开发人员、数据工程师和数据分析师,提升数据库操作效率和数据处理能力。关键词:PostgreSQL、SQL查询、数据库优化、数据工程、模式管理、性能调优、SQL调试。
BigQueryCLI数据查询技能指南Skill bigquery
本技能指南详细介绍了如何使用BigQuery命令行工具(bq)进行数据仓库查询和元数据检查,特别针对Monzo公司的数据分析项目。内容涵盖INFORMATION_SCHEMA元数据查询、数据敏感性处理、表结构检查、行数统计、模式匹配等核心功能,适用于数据工程师、分析师和开发人员进行安全高效的数据探索和验证工作。关键词:BigQuery CLI, bq命令, 数据仓库查询, INFORMATION_SCHEMA, 元数据检查, 数据敏感性, 表结构分析, 数据工程工具, Google Cloud, 数据分析工作流
因果推断方法Skill causal-inference-methods
本技能专注于应用高级计量与统计方法(如倾向得分匹配、工具变量、双重差分、断点回归)在观测数据中进行因果识别与效应评估。适用于政策评估、项目效果分析、社会科学研究等领域,旨在解决选择偏差、内生性等问题,提供可靠的因果推断依据。关键词:因果推断,倾向得分,工具变量,双重差分,断点回归,计量经济学,政策评估,效应识别。
系统动力学建模师Skill systems-dynamics-modeler
系统动力学建模师技能专注于构建和模拟系统动力学模型,用于分析复杂系统行为、识别反馈循环、预测涌现现象。该技能适用于科学发现、政策评估、情景规划等领域,通过存量-流量图建模、敏感性分析和多情景模拟,帮助用户深入理解动态系统的内在机制与长期演变趋势。关键词:系统动力学建模、复杂系统分析、反馈循环、情景模拟、科学发现、政策建模、行为预测、存量流量图。