端到端验证 PG public.app_user_cert_info → Hive test.raw_usr_app_user_cert_info_inc_d 同步。
-random 生效的必要条件,见 bin/common/init.sh worker 选择逻辑)datasource/postgresql/dev-poyee-xiaoxu.ini 由运维维护(真实 PG 连接)test 数据库已存在datasource/ + /opt/datax 同步到 cdhmaster02 / cdhnode01 / cdhnode02 / cdhnode03conf/workers.ini 配置当前集群 hostname + 权重ddl/hive_raw.sql 建 raw 表跑 DataX(新入口 datax-hive-import-starter):
bin/datax-hive-import-starter.sh \
-ini tests/integration/datax/hive_import/app_user_cert_info.ini \
-start-date <昨日 yyyymmdd> -stop-date <今日 yyyymmdd> \
-random
selected_worker 落到 cdhnode01 / cdhnode02 / cdhnode03 之一(权重 1:3:3:3,master 占 1/10)test.raw_usr_app_user_cert_info_inc_d 新增 dt=<昨日> 分区SELECT COUNT(*) FROM public.app_user_cert_info WHERE create_time >= '<昨日>' AND create_time < '<今日>'本套件作为两次回归的共同锚点:
datax-hive-import-starter 新入口开发完成后端到端等价ddl/hive_raw.sql:Hive 建表app_user_cert_info.ini:DataX ini