瀏覽代碼

docs(kb/91): 加 §0 待办 - 1 期 tdm 重跑两项

代码 commit e42c6ae 已 sync,DS UI 跑 tdm_usr_tag_d_init(dt=20260508) +
tdm_usr_tag_o_y2025 两个工作流,跑完按 kb/34 §6.2 INTERSECT 圈选验证.

Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
tianyu.chu 4 周之前
父節點
當前提交
40db65e75f
共有 1 個文件被更改,包括 22 次插入0 次删除
  1. 22 0
      kb/91-重构备忘.md

+ 22 - 0
kb/91-重构备忘.md

@@ -1,3 +1,25 @@
+## 0. 待办
+
+### 0.1 1 期 tdm 重跑(2026-05-12 加)
+
+代码已改完 + commit + sync m2/cdh(批 1 commit `e42c6ae`):
+
+- `jobs/tdm/usr/tdm_usr_tag_d.sql`:4 段 stat 跨层下钻 dwd + `order_type='group'` + tag_code 改 `usr_trade_*` + cnt 改 `COUNT(DISTINCT order_id)`
+- `manual/backfill/20260511_tdm_usr_tag_o_y2025.sql`:同上 + 扫 dwd 2025 全年
+
+待 DS UI 手动跑:
+
+| # | 工作流 | 项目 | 参数 | 备注 |
+|---|---|---|---|---|
+| 1 | `tdm_usr_tag_d_init` | manual | `${dt}=20260508` | 对齐 dim_usr 现有分区;INSERT OVERWRITE 自动覆盖 |
+| 2 | `tdm_usr_tag_o_y2025` | manual | dt 固定 `20251231`(SQL 内 PARTITION 已写死) | 跑完凝固永不变 |
+
+`dws_usr_user_trade_1d` **不重跑**(SQL 未改,保通用聚合语义;kb/93 ADR-10)。
+
+**验证**:跑完按 [kb/34 §6.2](34-标签字典.md#62-多标签人群圈选intersect业界-cdp-标准模式) INTERSECT 圈选 SQL 跑"上海男 × 篮球 25 年 > 200",能查到用户即口径正确。
+
+---
+
 ### 4.4 老 DataX 脚本 Worker 分发与日志链路(2026-04-23 查证)
 
 > 本节描述的是**老脚本**(`datax-single/multiple/multiple-hive-job-starter.sh`)的分发和日志行为。