tianyu.chu
|
281c625bb3
chore: 删 bin/flume-control.sh
|
2 veckor sedan |
tianyu.chu
|
de679ec092
refactor(conf): 环境变量外配到 conf/env.sh(bash+py 单源)
|
2 veckor sedan |
tianyu.chu
|
1b40b68d83
docs(kb): UDF 手册骨架搭建
|
2 veckor sedan |
tianyu.chu
|
f3396771dd
docs(kb): 新建 kb/31 UDF 手册骨架
|
2 veckor sedan |
tianyu.chu
|
8978b8712c
docs(kb): datasource 目录结构收敛到 kb/00 §1 一处
|
2 veckor sedan |
tianyu.chu
|
c1599f26e7
chore: .gitignore 排除 kb/inbox/ 草稿区
|
2 veckor sedan |
tianyu.chu
|
ac59f8c7e3
docs(kb): 30 删 §1 通用流程 / §4.5 占位模块,commit 信息归入 §3.4 Git 协作,节号重排(README/90 联动)
|
2 veckor sedan |
tianyu.chu
|
27c881f96e
docs(kb): 30 §4.6 整合 Git 协作规范
|
2 veckor sedan |
tianyu.chu
|
37930528e0
docs(kb): 30 §4.4 补 ops commit type(运维类操作)
|
2 veckor sedan |
tianyu.chu
|
51a41c2f99
docs(kb): raw 全量 EXTERNAL 硬化(CTAS 样例改两步 + §9.1 补 raw DDL 模板 + §8.1 dt 并入全字段 STRING)
|
2 veckor sedan |
tianyu.chu
|
eb86fe4256
docs(kb): ORC 走默认 + raw EXTERNAL + dt STRING 规范 + UDF 自查表计划 + 里程碑
|
2 veckor sedan |
tianyu.chu
|
de84fd2394
fix(dw_base): SPARK_CONF_DIR setdefault + 回退 HIVE_CONF_DIR + 删 HDP 残留注释
|
2 veckor sedan |
tianyu.chu
|
3784ea8ef2
fix(dw_base): 恢复 HIVE_CONF_DIR export 给 Spark Hive metastore 用
|
2 veckor sedan |
tianyu.chu
|
5b2569a712
refactor(udf): 删 geo_hash UDF 及 pygeohash 依赖,新项目暂无 geo 场景
|
2 veckor sedan |
tianyu.chu
|
294f374f23
docs(kb): 00 §1 jobs/ 注释去历史/新建辩解,调度表述对齐为定时
|
2 veckor sedan |
tianyu.chu
|
3d6b671d99
docs(kb): 00 §1 publish.sh 注释去掉多余设计解释
|
2 veckor sedan |
tianyu.chu
|
f3dd62abf7
docs(kb): 00 §1 同步 dw_base 子目录真实状态;§2 表砍、§3 Mermaid 清空占位
|
2 veckor sedan |
tianyu.chu
|
cf87744229
fix(dw_base): 恢复 HADOOP_CONF_DIR export 给 Spark 用(反转 04-18 删除决策)
|
2 veckor sedan |
tianyu.chu
|
fc59501757
docs(kb): 02 §3 补个人账号首次部署需 chmod +x bin/*.sh
|
2 veckor sedan |
tianyu.chu
|
eb87ace423
docs(kb): 00 §6.3 补 DataX ini 代码实现现状(ds_type 白名单 + RDBMS columnType 覆盖)
|
2 veckor sedan |
tianyu.chu
|
35ae11379d
chore(bin): DATAX_HOME 默认值对齐 /opt/datax 并改条件赋值
|
2 veckor sedan |
tianyu.chu
|
8d0ac728c4
docs(kb): 90 路线按聚簇+DAG 重组;30 §4.5 占位规范;92 同步本批
|
2 veckor sedan |
tianyu.chu
|
6936460ac3
chore: 新增 io/ops/pm/dq/sync/tests 占位骨架;删 bin/excel_to_hive.py;publish.sh 挪入 bin
|
2 veckor sedan |
tianyu.chu
|
6be2c2511d
docs(kb): DS 残留清 kb 前瞻;workers 锁 ini;spark-defaults 走 Spark 原生 .conf
|
2 veckor sedan |
tianyu.chu
|
727e4f2939
docs(kb): alerter + datax-speed 扩展名统一为 .ini;alerter 改为入库
|
2 veckor sedan |
tianyu.chu
|
cc2886f738
refactor: 删除 mongodb_utils + kb/90 §5.1 档案化
|
2 veckor sedan |
tianyu.chu
|
9b86d64274
refactor: 删除空壳模块 ml/elasticsearch/flink/validation
|
2 veckor sedan |
tianyu.chu
|
4c55533b2f
build(deps): 加入 pyspark==2.4.0 解决 PyCharm 远程解释器索引缺失
|
2 veckor sedan |
tianyu.chu
|
9e2d611a61
refactor(udf): 提升 UDF 为顶层模块 dw_base/udf/
|
2 veckor sedan |
tianyu.chu
|
e76ede8d15
docs(kb): 修正 §7.1 pyspark 依赖表述,改为 findspark 指向集群版
|
2 veckor sedan |