| 12345678910111213141516171819 |
- -- 作者:tianyu.chu
- -- 日期:2026-06-10
- -- 工单:(无)
- -- 目的:埋点 raw 薄表,承接固定服务器导出的埋点 gz;落脱敏后的 _source 整行 JSON,按 dt 分区 ORC 存储
- -- 状态:[待执行]
- -- 备注:薄表破例(不全 STRING 拍平)见 kb/13 §4 + ADR-06 旁;脱敏在入仓前的 Spark UDF 做,配套 conf/tracking-mask.ini;
- -- 拍平/类型转换在 ods、事件分类在 dwd;字段梳理见 workspace/.../埋点raw建模.md(待落 kb/16)
- DROP TABLE IF EXISTS raw.raw_usr_traces_inc_d;
- CREATE EXTERNAL TABLE IF NOT EXISTS raw.raw_usr_traces_inc_d (
- es_id STRING COMMENT 'ES 文档 _id,去重键',
- event_name STRING COMMENT '事件名(_source.event),便于 ods 路由',
- raw_json STRING COMMENT '脱敏后的 _source 整行 JSON'
- )
- COMMENT '埋点 raw 层(脱敏后整行 JSON)'
- PARTITIONED BY (dt STRING COMMENT 'yyyymmdd,取自 gz 文件名')
- STORED AS ORC
- LOCATION '/user/hive/warehouse/raw.db/raw_usr_traces_inc_d';
|