数据科学 Skill技能列表
PDF处理Skill pdf
PDF处理技能用于通过编程方式提取PDF文档中的文本和表格,创建、合并、分割PDF文件,以及填充表单。适用于文档自动化处理、数据提取和分析,常用于数据工程和软件开发场景。在股票量化交易中,此技能可辅助处理财务报告和交易文档,提取关键数据进行分析。关键词:PDF处理,文档提取,Python库,数据工程,自动化处理,量化交易,数据提取。
画布设计Skill canvas-design
画布设计技能专注于利用HTML Canvas API或现代设计工具,实现高效的数据可视化、交互式图形和动态动画创作。它融合了视觉设计原则和技术实现,适用于创建从静态海报到复杂交互界面的多样化视觉内容,提升用户体验和信息传达效果。关键词:画布设计、HTML Canvas、数据可视化、交互图形、视觉设计、动画、图像处理、前端开发、设计工具。
RevenueOperationsSkill revenue-operations
分析销售管道覆盖率,跟踪预测准确性与MAPE,并计算GTM效率指标,以优化SaaS收入
MongoDB数据库操作技能Skill mongodb
这个技能提供MongoDB数据库的全面指导,涵盖文档操作、查询、聚合、索引和最佳实践,适用于处理MongoDB数据、编写高效查询和优化数据库设计的场景。关键词包括MongoDB、数据库管理、文档存储、NoSQL、查询优化、索引策略。
创业趋势预测Skill startup-trend-prediction
这个技能提供系统化框架,通过分析2-3年的历史信号来预测未来1-2年的市场、技术或业务模型趋势。它结合采用曲线、周期模式和信号分析,评估市场进入时机(如进入/等待/避免),支持决策制定,包括趋势轨迹(上升/峰值/下降)、采用阶段识别等。关键词:趋势预测、市场分析、创业时机、数据驱动决策、采用曲线、市场进入、周期模式、信号分析。
数据迁移Skill data-migration
数据迁移技能专注于安全、高效地执行数据库和数据系统的迁移工作,包括规划迁移策略、实施数据转换、确保零停机部署以及设计回滚机制,以维护数据完整性和系统稳定性。关键词:数据库迁移,数据转换,零停机,安全架构,回滚策略,数据完整性。
时间序列数据库技术Skill using-timeseries-databases
时间序列数据库技术用于高效存储和查询时间戳数据,如金融交易数据、物联网传感器、监控指标和日志。该技能涉及数据库选择(包括TimescaleDB、InfluxDB、ClickHouse、QuestDB)、连续聚合、降采样(LTTB算法)和保留策略优化,适用于构建实时仪表板、监控系统、物联网平台和金融应用。关键词:时间序列数据库、数据存储、查询优化、数据库技术、降采样、连续聚合。
Matplotlib可视化技能Skill matplotlib
Matplotlib是Python的基础可视化库,用于创建静态、动画和交互式图表,支持高度自定义,适用于数据科学、学术研究和商业报告。关键词:数据可视化、Python绘图、科学图表、自定义绘图、图表库、可视化工具。
查询构建器Skill query-builder
该技能是一个交互式数据库查询构建工具,用于自动生成优化的SQL和NoSQL查询语句,支持多种数据库和ORM,提高开发效率和查询性能。关键词包括数据库查询、SQL优化、NoSQL、ORM、性能调优、数据工程、后端开发。
SQL开发Skill sql
SQL开发是一种专注于使用结构化查询语言进行数据库管理的技能,包括编写高效查询、优化执行计划、设计数据库模式和索引策略。它支持复杂操作如窗口函数、公共表表达式和递归查询,广泛应用于数据工程、后端开发和数据分析领域。关键词:SQL、数据库、查询优化、模式设计、数据工程、ETL、数据仓库。
预加载技能Skill preload
该技能用于在数据加载流程中检查landing或pending区域的文件可用性,确保文件就绪后触发加载,适用于数据工程、ETL开发和自动化编排,关键词:文件检查、数据加载、编排、ETL、数据仓库、预加载。
比较Skill compare
此 Starlake compare 技能用于数据工程项目的版本对比,生成差异报告,支持 Git 集成、文件路径和标签比较,便于审查 schema 更改、配置更新和发布管理。关键词包括 Starlake、比较、差异报告、schema 变化、数据工程、Git 版本控制、ETL 开发、数据治理,提升项目管理效率。