数据科学 Skill技能列表

4.5

Twitter数据抓取工具Skill twscrape

twscrape是一个专业的Python库,专门用于Twitter/X社交媒体数据抓取和爬虫开发。通过GraphQL API实现高效数据采集,支持多账号轮换管理、异步并行操作、代理配置和会话持久化。适用于社交媒体监控、舆情分析、用户行为研究、趋势挖掘和大规模数据收集场景。关键词:Twitter爬虫、社交媒体数据采集、Python数据抓取、账号轮换、GraphQL API、异步爬虫、数据挖掘、舆情监控。

4.5

金融科技工程师Skill fintech-engineer

金融科技工程师专注于设计和实施金融技术系统,包括双分录账簿、高精度财务计算、支付处理架构和监管合规性。关键词包括:支付系统、账簿架构、财务计算、PCI合规性、银行API集成。

4.5

Excel作业定义转YAML技能Skill xls2ymljob

这是一个用于数据工程的工具,能够将Excel电子表格中描述的任务定义高效转换为Starlake YAML配置文件,支持批量处理和策略集成,适用于ETL开发和数据治理。关键词:Excel, YAML, Starlake, 任务转换, ETL开发, 数据工程, 数据治理, 配置文件。

4.5

仪器数据Allotrope转换器Skill bio-instrument-data

该技能用于将实验室仪器输出文件转换为标准化的Allotrope Simple Model (ASM) JSON格式或扁平化2D CSV,便于在LIMS系统、数据湖中使用或进行下游分析。它支持自动检测仪器类型,并提供ASM JSON、CSV和Python代码输出,帮助数据工程师集成到生产管道中。关键词:仪器数据转换、Allotrope标准化、LIMS系统、数据工程、生物信息学、数据湖、Python解析器。

4.5

YAML转Excel转换器Skill yml2xls

该技能用于将 Starlake YAML 数据定义转换为 Excel 电子表格,便于与非技术用户共享数据模型,支持 YAML 和 Excel 之间的双向转换,适用于数据工程、数据治理和数据处理工作流。关键词:YAML 转 Excel, Starlake 数据转换, 数据模型共享, 数据工程工具, ETL 开发, 数据可视化。

4.5

电子书文本提取器Skill ebook-extractor

电子书文本提取器是一个用于从EPUB、MOBI、PDF格式电子书中提取纯文本的工具。它支持常见电子书格式,使用Python脚本实现,无需大型语言模型调用,纯文本提取。适用于数据分析、文本处理、阅读转换等场景。关键词:电子书提取、文本转换、Python工具、EPUB、MOBI、PDF、数据提取。

4.5

邓白氏数据Skill dun-bradstreet-data

邓白氏数据技能是一个商业数据集成工具,用于企业信息查询、邓氏编码匹配、公司层级映射、财务风险评估和行业分类。它通过调用D&B Direct+ API,为CRM系统、销售团队和风控部门提供权威的企业画像数据,以提升客户数据质量、优化线索评分、辅助信用决策和实现精准的区域与行业细分。关键词:邓白氏,DUNS编码,企业数据,信用风险,公司层级,行业分类,CRM集成,数据丰富化。

4.5

ACL依赖关系图生成技能Skill acl-dependencies

该技能用于生成基于YAML配置中ACL(访问控制列表)定义的用户/组与数据库表之间访问权限的可视化依赖关系图。关键词:ACL、访问控制、依赖关系、可视化图、数据安全、权限管理、YAML配置、数据治理、DevOps工具。

4.5

Kafka数据加载技能Skill kafkaload

Kafka 数据加载技能是一个用于在 Apache Kafka 主题和文件系统之间高效传输数据的工具。它支持批处理和流式处理模式,提供数据转换功能,适用于数据集成、ETL 流程和大数据处理场景。关键词:Kafka、数据加载、数据卸载、批处理、流式处理、数据转换、ETL。

4.5

PDF处理Skill pdf

PDF处理技能是一种使用Python库和工具进行PDF文档操作的技能,包括文本提取、表格提取、PDF创建、合并、分割、表单处理、OCR等。适用于数据提取、文档自动化、数据预处理等场景。关键词:PDF处理、文本提取、表格提取、OCR、Python、数据工程、文档自动化、PDF库。

4.5

scikit-survival:生存分析工具包Skill scikit-survival

scikit-survival是一个基于scikit-learn的Python库,专门用于生存分析和时间到事件建模。它处理截尾数据,提供多种模型如Cox比例风险模型、随机生存森林和生存支持向量机,并支持模型评估如一致性指数和Brier分数。适用于医学研究、金融风险评估和生物统计等领域。关键词:生存分析、Python、scikit-survival、截尾数据、Cox模型、机器学习、预测建模、数据分析。

4.5

scikit-survival生存分析技能Skill scikit-survival

scikit-survival 是一个用于生存分析和时间到事件建模的 Python 工具包。它适用于处理截尾数据、拟合 Cox 模型、随机生存森林、梯度提升模型或生存 SVM,使用一致性指数或 Brier 分数评估预测,处理竞争风险,或实现任何生存分析工作流。关键词:生存分析,时间到事件建模,截尾数据,Cox 模型,随机生存森林,梯度提升,生存 SVM,一致性指数,Brier 分数,竞争风险,Python 库,预测建模。