name: freshness description: 检查数据新鲜度和最后更新时间戳
Freshness Skill
通过查询最后更新时间戳来检查数据表的新鲜度。结果存储在 SL_LAST_EXPORT 审计表中,用于监控和报警。
用法
starlake freshness [选项]
选项
--connection <值>: 从application.sl.yml中的连接引用--database <值>: 数据库 / GCP 项目 ID--tables <值>: 以逗号分隔的数据集.表对列表进行检查--external: 包括在_config.sl.yml中定义的外部数据集--write <值>: 写入模式:OVERWRITE,APPEND--accessToken <值>: 用于认证的访问令牌--persist <值>: 持久化结果到审计表 (true/false)--reportFormat <值>: 报告输出格式:console,json, 或html
配置上下文
新鲜度阈值可以在域或表级别定义:
# 在 _config.sl.yml 或 table.sl.yml 中
load:
metadata:
freshness:
warn: "24h" # 警告如果数据超过 24 小时
error: "48h" # 错误如果数据超过 48 小时
示例
检查特定表的新鲜度
starlake freshness --tables starbake.orders,starbake.customers --persist true
检查所有表的新鲜度
starlake freshness --database my-gcp-project --persist true
使用连接检查新鲜度
starlake freshness --connection duckdb --tables starbake.orders