name: 增量模型策略选择器 description: 选择和配置最优的增量模型策略 version: 1.0.0 category: 数据转换 skillId: SK-DEA-019 allowed-tools:
- Read
- Write
- Edit
- Glob
- Grep
- Bash
增量模型策略选择器
概述
选择和配置最优的增量模型策略。此技能通过适当的增量处理模式优化数据转换效率。
能力
- 增量策略选择(追加、合并、删除+插入)
- 分区裁剪优化
- 唯一键配置
- 模式变更处理
- 全量刷新调度
- 回看窗口优化
- 迟到数据处理
输入模式
{
"modelCharacteristics": {
"sourceType": "string",
"updatePattern": "append|update|delete",
"volumeGB": "number",
"updateFrequency": "string"
},
"platform": "snowflake|bigquery|redshift",
"existingModel": "object"
}
输出模式
{
"strategy": "append|merge|delete+insert",
"config": "object",
"partitionStrategy": "object",
"refreshSchedule": "object",
"dbtConfig": "object"
}
目标流程
- 增量模型设置
- dbt模型开发
- 管道迁移
使用指南
- 分析源数据更新模式
- 测量数据量和更新频率
- 根据特征选择策略
- 配置适当的回看窗口
最佳实践
- 对仅插入的源使用追加策略
- 对有更新的源使用合并策略
- 为大型表配置分区裁剪
- 安排定期全量刷新以进行数据校正
- 使用适当的回看窗口处理迟到数据