tianyu.chu
|
ce9422da14
fix(conf): 删 hive.exec.orc.default.block.size(与集群 dfs.blocksize 同值,无效果)
|
2 nedēļas atpakaļ |
tianyu.chu
|
4eccb63140
feat(conf): Spark 参数两文件外配 + spark_sql.py 三级覆盖
|
2 nedēļas atpakaļ |
tianyu.chu
|
709ca3920b
refactor(dw_base): __init__.py 去 findspark 与 21 个未用颜色常量
|
2 nedēļas atpakaļ |
tianyu.chu
|
606a202bee
docs(kb): 下线重构阶段 3、取消 UDF 注释补齐、kb/31 登记 13 个通用 UDF
|
2 nedēļas atpakaļ |
tianyu.chu
|
b43a9cbaa8
chore: 回退 SQL 样式基线,删 sql_style.xml 与 kb/30 §3.2.1/§3.2.2
|
2 nedēļas atpakaļ |
tianyu.chu
|
35f6dfb10b
docs(sql): sql_style 移项目根并重订 SQL 风格
|
2 nedēļas atpakaļ |
tianyu.chu
|
281c625bb3
chore: 删 bin/flume-control.sh
|
2 nedēļas atpakaļ |
tianyu.chu
|
de679ec092
refactor(conf): 环境变量外配到 conf/env.sh(bash+py 单源)
|
2 nedēļas atpakaļ |
tianyu.chu
|
1b40b68d83
docs(kb): UDF 手册骨架搭建
|
2 nedēļas atpakaļ |
tianyu.chu
|
f3396771dd
docs(kb): 新建 kb/31 UDF 手册骨架
|
2 nedēļas atpakaļ |
tianyu.chu
|
8978b8712c
docs(kb): datasource 目录结构收敛到 kb/00 §1 一处
|
2 nedēļas atpakaļ |
tianyu.chu
|
ac59f8c7e3
docs(kb): 30 删 §1 通用流程 / §4.5 占位模块,commit 信息归入 §3.4 Git 协作,节号重排(README/90 联动)
|
2 nedēļas atpakaļ |
tianyu.chu
|
27c881f96e
docs(kb): 30 §4.6 整合 Git 协作规范
|
2 nedēļas atpakaļ |
tianyu.chu
|
37930528e0
docs(kb): 30 §4.4 补 ops commit type(运维类操作)
|
2 nedēļas atpakaļ |
tianyu.chu
|
51a41c2f99
docs(kb): raw 全量 EXTERNAL 硬化(CTAS 样例改两步 + §9.1 补 raw DDL 模板 + §8.1 dt 并入全字段 STRING)
|
2 nedēļas atpakaļ |
tianyu.chu
|
eb86fe4256
docs(kb): ORC 走默认 + raw EXTERNAL + dt STRING 规范 + UDF 自查表计划 + 里程碑
|
2 nedēļas atpakaļ |
tianyu.chu
|
3784ea8ef2
fix(dw_base): 恢复 HIVE_CONF_DIR export 给 Spark Hive metastore 用
|
2 nedēļas atpakaļ |
tianyu.chu
|
5b2569a712
refactor(udf): 删 geo_hash UDF 及 pygeohash 依赖,新项目暂无 geo 场景
|
2 nedēļas atpakaļ |
tianyu.chu
|
f3dd62abf7
docs(kb): 00 §1 同步 dw_base 子目录真实状态;§2 表砍、§3 Mermaid 清空占位
|
2 nedēļas atpakaļ |
tianyu.chu
|
cf87744229
fix(dw_base): 恢复 HADOOP_CONF_DIR export 给 Spark 用(反转 04-18 删除决策)
|
2 nedēļas atpakaļ |
tianyu.chu
|
35ae11379d
chore(bin): DATAX_HOME 默认值对齐 /opt/datax 并改条件赋值
|
2 nedēļas atpakaļ |
tianyu.chu
|
8d0ac728c4
docs(kb): 90 路线按聚簇+DAG 重组;30 §4.5 占位规范;92 同步本批
|
2 nedēļas atpakaļ |
tianyu.chu
|
6be2c2511d
docs(kb): DS 残留清 kb 前瞻;workers 锁 ini;spark-defaults 走 Spark 原生 .conf
|
2 nedēļas atpakaļ |
tianyu.chu
|
727e4f2939
docs(kb): alerter + datax-speed 扩展名统一为 .ini;alerter 改为入库
|
2 nedēļas atpakaļ |
tianyu.chu
|
cc2886f738
refactor: 删除 mongodb_utils + kb/90 §5.1 档案化
|
2 nedēļas atpakaļ |
tianyu.chu
|
9b86d64274
refactor: 删除空壳模块 ml/elasticsearch/flink/validation
|
2 nedēļas atpakaļ |
tianyu.chu
|
4c55533b2f
build(deps): 加入 pyspark==2.4.0 解决 PyCharm 远程解释器索引缺失
|
2 nedēļas atpakaļ |
tianyu.chu
|
9e2d611a61
refactor(udf): 提升 UDF 为顶层模块 dw_base/udf/
|
2 nedēļas atpakaļ |
tianyu.chu
|
e76ede8d15
docs(kb): 修正 §7.1 pyspark 依赖表述,改为 findspark 指向集群版
|
2 nedēļas atpakaļ |
tianyu.chu
|
c6db00f6cf
refactor(spark/udf): 整合通用 UDF 为单文件,删除老业务 UDF 目录
|
2 nedēļas atpakaļ |