数据科学 Skill技能列表
数据质量分析器Skill data-quality-profiler
数据质量分析器是一款专业的数据剖析工具,用于全面评估数据资产的六个核心质量维度(完整性、准确性、一致性、有效性、及时性、唯一性)。它能自动检测数据异常、识别个人身份信息(PII)、进行统计剖析和模式识别,并生成包含可操作建议的详细质量报告。适用于数据治理、ETL/ELT流程监控、数据仓库质量保障和合规性检查。关键词:数据质量,数据剖析,异常检测,PII识别,数据治理,统计分析,质量报告,数据完整性,数据准确性,数据一致性。
ETL管道构建器Skill etl-pipeline-builder
ETL管道构建器是一个用于自动化构建和管理数据迁移管道的技能。它专注于数据提取、转换和加载(ETL)流程,支持增量加载、变更数据捕获(CDC)以及全面的监控告警功能。关键词:ETL开发,数据管道,数据迁移,CDC,增量加载,数据工程,数据集成,Airflow,dbt,数据仓库。
竞争分析师智能体Skill competitive-analyst
竞争分析师智能体是一个专注于系统性竞争对手分析、市场定位评估和战略优势识别的专业工具。它擅长进行多维竞争格局映射、能力评估和制定战略建议。通过整合公共信息挖掘、市场情报综合和高级分析技术(如SWOT分析增强、战争游戏模拟),为企业提供可操作的竞争洞察,支持市场进入决策、产品开发、定价策略和竞争响应规划。关键词:竞争分析,市场情报,战略规划,竞争对手评估,SWOT分析,战争游戏,商业智能,市场定位。
Metabase数据自动化Skill data-metabase
这个技能用于通过REST API自动化Metabase平台,实现认证、导出和更新问题(卡片)与仪表板、标准化可视化设置,并运行或导出结果,适用于数据工程和商业智能场景,关键词包括Metabase、API自动化、数据可视化、商业智能、BI报表。
CSV数据可视化器Skill csv-data-visualizer
CSV数据可视化器是一款强大的Python工具集,专为数据科学家、分析师和开发者设计,用于对CSV格式的数据进行深度探索、分析和可视化呈现。核心功能包括:1. 利用Plotly库创建交互式图表(如直方图、散点图、箱线图、热力图等);2. 自动数据剖析,生成包含统计摘要、数据质量检查和分布分析的详细报告;3. 一键生成或自定义配置多图表仪表板。该工具旨在简化从数据加载、质量评估到可视化洞察的完整工作流,支持HTML、PNG、PDF等多种输出格式,是进行探索性数据分析(EDA)、制作数据报告和构建数据看板的理想选择。 关键词:CSV数据分析,数据可视化,Plotly图表,探索性数据分析EDA,数据剖析,统计报告,交互式仪表板,Python数据分析工具,数据质量检查,自动化数据洞察。
高级数据工程师Skill senior-data-engineer
高级数据工程师技能专注于构建和管理企业级数据基础设施。核心能力包括设计和实施可扩展的数据管道、ETL/ELT系统,以及高效的数据处理工作流。精通Python、SQL、Spark、Airflow、dbt、Kafka等现代数据技术栈,涵盖数据建模、管道编排、数据质量保证和DataOps实践。适用于大数据处理、数据仓库建设、AI/ML数据供给、实时数据流处理和数据治理等场景,旨在为数据驱动型业务提供可靠、高性能的数据基础。关键词:数据工程,ETL,数据管道,数据架构,大数据,Spark,Airflow,数据建模,DataOps,数据基础设施。
数据故事讲述分析师Skill data-storytelling-analyst
数据故事讲述分析师是将原始数据转化为引人入胜的可视化叙事,利用Python或R工具,专注于数据清晰度、洞察力挖掘和美学呈现的专业技能。适用于数据分析、数据可视化、商业智能、叙事设计和信息设计等领域,关键词包括:数据可视化、故事讲述、Python数据分析、R编程、探索性数据分析(EDA)、图表美学、SEO叙事洞察。
数据库工程精通Skill afrexai-database-engineer
提供全面的数据库设计、优化、迁移和运维指导,包括模式设计、索引策略、查询优化、数据库迁移、性能监控、备份与恢复、安全防护等关键领域的深入分析和最佳实践。
网络爬虫Skill web-scraping
网络爬虫技能用于从网站提取数据,包括绕过反爬虫机制、内容提取、处理未记录API和毒丸检测。适用于数据采集、内容分析、社交媒体处理和SEO优化。关键词包括网络爬虫、数据提取、反爬虫、API爬取、毒丸检测、网页抓取、数据工程。
PROMETHEE多准则决策评估器Skill promethee-evaluator
PROMETHEE 多准则决策评估器是一种基于优劣排序的量化分析工具,用于处理多目标、多准则的复杂决策问题。它通过成对比较备选方案,利用多种偏好函数(如线性、高斯型)计算偏好度,并生成正流量、负流量和净流量,最终提供 PROMETHEE I(部分排序)和 PROMETHEE II(完全排序)结果。该工具支持 GAIA 平面可视化进行数据降维和敏感性分析,广泛应用于供应商选择、资源分配、投资组合优化等商业决策场景。关键词:多准则决策分析,PROMETHEE,优劣排序,偏好函数,GAIA可视化,量化决策,商业智能,MCDA。
数据可视化Skill data-visualization
数据可视化技能是一个用于将数据转换为直观图表、图形和报告的工具。它支持多种图表类型(如折线图、柱状图、散点图、热力图等)和主流可视化库(如Matplotlib、Seaborn、Plotly),帮助用户进行数据分析、商业智能展示和量化金融建模。关键词:数据可视化,图表生成,数据分析,Python绘图,商业智能,量化金融,Matplotlib,Seaborn,数据报告。
回归建模Skill RegressionModeling
构建预测模型,用于连续预测、趋势预测和关系量化