raw_usr_traces_inc_d_create.sql 1016 B

12345678910111213141516171819
  1. -- 作者:tianyu.chu
  2. -- 日期:2026-06-10
  3. -- 工单:(无)
  4. -- 目的:埋点 raw 薄表,承接固定服务器导出的埋点 gz;落脱敏后的 _source 整行 JSON,按 dt 分区 ORC 存储
  5. -- 状态:[待执行]
  6. -- 备注:薄表破例(不全 STRING 拍平)见 kb/13 §4 + ADR-06 旁;脱敏在入仓前的 Spark UDF 做,配套 conf/tracking-mask.ini;
  7. -- 拍平/类型转换在 ods、事件分类在 dwd;字段梳理见 workspace/.../埋点raw建模.md(待落 kb/16)
  8. DROP TABLE IF EXISTS raw.raw_usr_traces_inc_d;
  9. CREATE EXTERNAL TABLE IF NOT EXISTS raw.raw_usr_traces_inc_d (
  10. es_id STRING COMMENT 'ES 文档 _id,去重键',
  11. event_name STRING COMMENT '事件名(_source.event),便于 ods 路由',
  12. raw_json STRING COMMENT '脱敏后的 _source 整行 JSON'
  13. )
  14. COMMENT '埋点 raw 层(脱敏后整行 JSON)'
  15. PARTITIONED BY (dt STRING COMMENT 'yyyymmdd,取自 gz 文件名')
  16. STORED AS ORC
  17. LOCATION '/user/hive/warehouse/raw.db/raw_usr_traces_inc_d';