数据科学 - SkillsBot AI Skill技能库

ClassificationModelingSkill ClassificationModeling

构建用于分类预测和分类的二元和多类分类模型

时间序列数据库技术Skill using-timeseries-databases

时间序列数据库技术用于高效存储和查询时间戳数据，如金融交易数据、物联网传感器、监控指标和日志。该技能涉及数据库选择（包括TimescaleDB、InfluxDB、ClickHouse、QuestDB）、连续聚合、降采样（LTTB算法）和保留策略优化，适用于构建实时仪表板、监控系统、物联网平台和金融应用。关键词：时间序列数据库、数据存储、查询优化、数据库技术、降采样、连续聚合。

数据库索引策略Skill database-indexing-strategy

本技能涉及数据库索引策略的设计和实施，包括索引创建、查询性能优化、索引类型选择、复合和部分索引设计、索引维护和监控等，旨在提高数据库查询效率和数据完整性。

预测预死亡分析Skill forecast-premortem

预测预死亡分析是一种用于压力测试预测的技术，通过假设预测已经失败并逆向工作来识别原因，从而揭示盲点、尾部风险和过度自信。适用于高置信度预测、识别未知风险或调整置信区间。关键词：预测预死亡、风险识别、压力测试、置信区间调整、预测建模、数据科学。

日志解析与导入SOPSkill "self/import/file_path"

此技能是定义和执行日志解析的标准操作程序（SOP），用于处理Apache、Nginx、Syslog、JSON和自定义等多种日志格式，通过数据类和LogEntry类表示解析后的日志条目。它帮助用户标准化日志处理流程，提高数据解析效率，便于数据收集和分析。关键词：日志解析、SOP、文件导入、Apache日志、Nginx日志、Syslog、JSON日志、自定义日志、数据工程、数据类、LogEntry。

时间序列分析师Skill time-series-analyst

时间序列分析技能用于分析时间序列数据，识别模式、趋势、季节性和异常，并使用统计和机器学习方法进行预测。适用于金融、经济、销售预测、库存管理等领域，关键词包括时间序列分析、预测建模、ARIMA、机器学习、异常检测。

数据迁移专家Skill data-migration-expert

此技能用于数据库迁移过程中的数据完整性和安全性验证，确保数据无损坏。通过检查ID映射、交换值、回滚策略等，防止迁移错误。关键词：数据迁移、数据库安全、完整性验证、ID映射检查、回滚安全、迁移审查。

Python科学计算技能Skill pycse

pycse 是一个 Python 库，用于科学和工程计算，提供自动计算置信区间和预测边界的回归分析、模型拟合、ODE 求解和缓存功能。简化数据分析和预测建模流程，提高效率，关键词：Python, 科学计算, 回归分析, 置信区间, 预测建模, 模型拟合, ODE, 缓存。

SQL开发Skill sql

SQL开发是一种专注于使用结构化查询语言进行数据库管理的技能，包括编写高效查询、优化执行计划、设计数据库模式和索引策略。它支持复杂操作如窗口函数、公共表表达式和递归查询，广泛应用于数据工程、后端开发和数据分析领域。关键词：SQL、数据库、查询优化、模式设计、数据工程、ETL、数据仓库。

DAG部署技能Skill dag-deploy

DAG部署技能专用于自动化部署生成的DAG文件到目标目录，如Airflow DAGs文件夹，支持清理和文件组织，优化数据管道管理，适用于数据工程、ETL开发和DevOps场景，提升数据工作流效率。

引导技能Skill bootstrap

引导技能是Starlake数据工程工具的核心功能，用于快速创建新的项目结构和配置文件。它支持使用模板进行项目搭建，包含标准目录、配置示例和数据，适用于数据工程师进行ETL开发、数据加载和转换。关键词：Starlake、项目引导、模板、配置、数据工程、ETL开发。

Python数据管道开发Skill python-pipeline

该技能用于构建模块化的Python数据处理管道，支持工作流协调、内容类型调度、Google Sheets/Drive API集成和AI服务应用。适用于内容处理、批量处理系统和数据工程场景，提高数据处理效率和自动化水平。关键词：Python、数据管道、模块化架构、调度器、Google Sheets集成、AI集成、ETL、数据处理、批量处理、工作流自动化。