Переглянути джерело

docs(kb): raw 接入族 — 22 补字段目录来源 + 脱敏清单指针,15 脱敏方法指向模板

- 22 §0.4:字段表来自 sync 生成器人工同步(来源标记);脱敏方法清单单一真值指向 conf 模板 + mask.py
- 15 Step 3:脱敏方法等改为全清单指向 mask.template.ini

Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>
tianyu.chu 1 тиждень тому
батько
коміт
8049b9dd3b
2 змінених файлів з 6 додано та 1 видалено
  1. 1 1
      kb/15-raw接入流程.md
  2. 5 0
      kb/22-raw建模.md

+ 1 - 1
kb/15-raw接入流程.md

@@ -88,7 +88,7 @@ python3 bin/datax-sync-template-gen.py \
 
 ### Step 3:写 mask 配置
 
-落位 `jobs/raw/{域}/{table}.mask.ini`,参考 `conf/templates/datax/mask/mask.template.ini` 格式
+落位 `jobs/raw/{域}/{table}.mask.ini`,参考 `conf/templates/datax/mask/mask.template.ini`(脱敏方法清单 `trim` / `md5` / `month_trunc` / `mask_middle` / `keep_first_n` / `keep_last_n` 的单一真值)
 
 ```ini
 [mask]

+ 5 - 0
kb/22-raw建模.md

@@ -38,6 +38,11 @@
 
 raw 层是否需要 `etl_load_time` / `src_file` / `src_row_no` 等框架字段,暂不做统一要求,后续实际接入时再按需补充。
 
+### 0.4 字段目录来源与脱敏
+
+- 下方各源表字段表由 `bin/datax-sync-template-gen.py` 生成的 `.md` **人工同步**而来(流程见 `15-raw接入流程.md` Step 6);源表 schema 变更后需手动回填,非脚本自动追加
+- 字段裁剪与脱敏在接入流程定义(见 `15-raw接入流程.md`);**脱敏方法清单**(`trim` 不入仓 + `md5` / `month_trunc` / `mask_middle` / `keep_first_n` / `keep_last_n`)的单一真值见 `conf/templates/datax/mask/mask.template.ini`(SQL 实现 `dw_base/datax/mask.py`)
+
 ## 1. card_group_order_info(拼团订单)
 
 ### 探查