name: esload description: 将数据加载到Elasticsearch中
ESLoad 技能
从文件(Parquet、JSON)加载数据到Elasticsearch索引。支持自定义映射、文档ID和基于时间戳的索引命名。
用法
starlake esload [options]
选项
--domain <值>: 域名(必需)--schema <值>: 模式/表名(必需)--format <值>: 输入文件格式:parquet、json或json-array(必需)--dataset <值>: 输入数据集路径--timestamp <值>: Elasticsearch索引时间戳后缀,例如{@timestamp|yyyy.MM.dd}--id <值>: 用作Elasticsearch文档ID的属性名--mapping <值>: 自定义Elasticsearch映射文件路径--conf k1=v1,k2=v2: Elasticsearch-Spark配置选项--reportFormat <值>: 报告输出格式:console、json或html
示例
加载Parquet数据到Elasticsearch
starlake esload --domain starbake --schema orders --format parquet
加载JSON并自定义文档ID
starlake esload --domain starbake --schema orders --format json --id order_id
加载并基于时间戳索引
starlake esload --domain starbake --schema orders --format parquet --timestamp "{@timestamp|yyyy.MM.dd}"
加载并自定义映射
starlake esload --domain starbake --schema orders --format json --mapping /path/to/mapping.json
从特定数据集路径加载
starlake esload --domain starbake --schema orders --format parquet --dataset /data/orders/