- -- Hive raw 层贴源表(埋点冒烟测试)
- --
- -- 源:m2:/data/upload/tracking/temp/traces-{YYYY-MM-DD}.json.gz(ES NDJSON 导出)
- -- 库:test(测试期);正式上线迁到 raw 库,表名/结构/LOCATION(除 db 段)保留
- -- 存储:TEXTFILE 直存 .gz(gz 不解压上 HDFS,TextInputFormat 自动按后缀解压读取)
- -- 分区:dt=yyyymmdd(来自文件名)
- -- 字段:仅 raw_json 一列,存 ES hit 整行(含 _index/_type/_id/_score/_source)
- CREATE EXTERNAL TABLE IF NOT EXISTS test.raw_usr_traces_apd_d (
- raw_json STRING COMMENT 'ES hit 整行 JSON(含 _index/_type/_id/_score/_source)'
- )
- COMMENT '埋点贴源表(ES NDJSON.gz 原文,冒烟测试)'
- PARTITIONED BY (dt STRING COMMENT 'yyyymmdd')
- STORED AS TEXTFILE
- LOCATION '/user/hive/warehouse/test.db/raw_usr_traces_apd_d';
|