|
|
@@ -1,3 +1,25 @@
|
|
|
+## 0. 待办
|
|
|
+
|
|
|
+### 0.1 1 期 tdm 重跑(2026-05-12 加)
|
|
|
+
|
|
|
+代码已改完 + commit + sync m2/cdh(批 1 commit `e42c6ae`):
|
|
|
+
|
|
|
+- `jobs/tdm/usr/tdm_usr_tag_d.sql`:4 段 stat 跨层下钻 dwd + `order_type='group'` + tag_code 改 `usr_trade_*` + cnt 改 `COUNT(DISTINCT order_id)`
|
|
|
+- `manual/backfill/20260511_tdm_usr_tag_o_y2025.sql`:同上 + 扫 dwd 2025 全年
|
|
|
+
|
|
|
+待 DS UI 手动跑:
|
|
|
+
|
|
|
+| # | 工作流 | 项目 | 参数 | 备注 |
|
|
|
+|---|---|---|---|---|
|
|
|
+| 1 | `tdm_usr_tag_d_init` | manual | `${dt}=20260508` | 对齐 dim_usr 现有分区;INSERT OVERWRITE 自动覆盖 |
|
|
|
+| 2 | `tdm_usr_tag_o_y2025` | manual | dt 固定 `20251231`(SQL 内 PARTITION 已写死) | 跑完凝固永不变 |
|
|
|
+
|
|
|
+`dws_usr_user_trade_1d` **不重跑**(SQL 未改,保通用聚合语义;kb/93 ADR-10)。
|
|
|
+
|
|
|
+**验证**:跑完按 [kb/34 §6.2](34-标签字典.md#62-多标签人群圈选intersect业界-cdp-标准模式) INTERSECT 圈选 SQL 跑"上海男 × 篮球 25 年 > 200",能查到用户即口径正确。
|
|
|
+
|
|
|
+---
|
|
|
+
|
|
|
### 4.4 老 DataX 脚本 Worker 分发与日志链路(2026-04-23 查证)
|
|
|
|
|
|
> 本节描述的是**老脚本**(`datax-single/multiple/multiple-hive-job-starter.sh`)的分发和日志行为。
|