Selaa lähdekoodia

feat(raw): 埋点 raw 薄表 DDL raw_usr_traces_inc_d

tianyu.chu 5 päivää sitten
vanhempi
commit
0e449e8906
1 muutettua tiedostoa jossa 19 lisäystä ja 0 poistoa
  1. 19 0
      manual/ddl/raw/usr/raw_usr_traces_inc_d_create.sql

+ 19 - 0
manual/ddl/raw/usr/raw_usr_traces_inc_d_create.sql

@@ -0,0 +1,19 @@
+-- 作者:tianyu.chu
+-- 日期:2026-06-10
+-- 工单:(无)
+-- 目的:埋点 raw 薄表,承接固定服务器导出的埋点 gz;落脱敏后的 _source 整行 JSON,按 dt 分区 ORC 存储
+-- 状态:[待执行]
+-- 备注:薄表破例(不全 STRING 拍平)见 kb/13 §4 + ADR-06 旁;脱敏在入仓前的 Spark UDF 做,配套 conf/tracking-mask.ini;
+--       拍平/类型转换在 ods、事件分类在 dwd;字段梳理见 workspace/.../埋点raw建模.md(待落 kb/16)
+
+DROP TABLE IF EXISTS raw.raw_usr_traces_inc_d;
+
+CREATE EXTERNAL TABLE IF NOT EXISTS raw.raw_usr_traces_inc_d (
+    es_id      STRING COMMENT 'ES 文档 _id,去重键',
+    event_name STRING COMMENT '事件名(_source.event),便于 ods 路由',
+    raw_json   STRING COMMENT '脱敏后的 _source 整行 JSON'
+)
+COMMENT '埋点 raw 层(脱敏后整行 JSON)'
+PARTITIONED BY (dt STRING COMMENT 'yyyymmdd,取自 gz 文件名')
+STORED AS ORC
+LOCATION '/user/hive/warehouse/raw.db/raw_usr_traces_inc_d';