|
@@ -0,0 +1,19 @@
|
|
|
|
|
+-- 作者:tianyu.chu
|
|
|
|
|
+-- 日期:2026-06-10
|
|
|
|
|
+-- 工单:(无)
|
|
|
|
|
+-- 目的:埋点 raw 薄表,承接固定服务器导出的埋点 gz;落脱敏后的 _source 整行 JSON,按 dt 分区 ORC 存储
|
|
|
|
|
+-- 状态:[待执行]
|
|
|
|
|
+-- 备注:薄表破例(不全 STRING 拍平)见 kb/13 §4 + ADR-06 旁;脱敏在入仓前的 Spark UDF 做,配套 conf/tracking-mask.ini;
|
|
|
|
|
+-- 拍平/类型转换在 ods、事件分类在 dwd;字段梳理见 workspace/.../埋点raw建模.md(待落 kb/16)
|
|
|
|
|
+
|
|
|
|
|
+DROP TABLE IF EXISTS raw.raw_usr_traces_inc_d;
|
|
|
|
|
+
|
|
|
|
|
+CREATE EXTERNAL TABLE IF NOT EXISTS raw.raw_usr_traces_inc_d (
|
|
|
|
|
+ es_id STRING COMMENT 'ES 文档 _id,去重键',
|
|
|
|
|
+ event_name STRING COMMENT '事件名(_source.event),便于 ods 路由',
|
|
|
|
|
+ raw_json STRING COMMENT '脱敏后的 _source 整行 JSON'
|
|
|
|
|
+)
|
|
|
|
|
+COMMENT '埋点 raw 层(脱敏后整行 JSON)'
|
|
|
|
|
+PARTITIONED BY (dt STRING COMMENT 'yyyymmdd,取自 gz 文件名')
|
|
|
|
|
+STORED AS ORC
|
|
|
|
|
+LOCATION '/user/hive/warehouse/raw.db/raw_usr_traces_inc_d';
|