|
|
hace 1 semana | |
|---|---|---|
| .. | ||
| integration | hace 1 semana | |
| unit | hace 1 semana | |
| README.md | hace 2 semanas | |
对 dw_base/ 下的代码(尤其是 UDF、utils、io、dq、pm 等模块)做自动化测试,保证重构与新开发不回退。
unit/ —— 单元测试。无外部依赖(不连真实 Spark 集群 / DB),Spark 相关用本地 SparkSession 或 mockintegration/ —— 集成测试。连真实 Spark / MySQL / HDFS,验证端到端链路conftest.py(后续加)—— pytest fixtures:fake_spark、tmp_hdfs、sample_df 等pytest tests/unit / pytest tests/integration。CI 只跑 unit(集成测试手动触发)。
tests/unit/udf/test_spark_common_udf.py —— 对 dw_base/udf/common/spark_common_udf.py 40 个函数的单测(本地 SparkSession,小样本 DataFrame)tests/unit/utils/ —— 对 dw_base/utils/* 的纯函数单测tests/unit/datax/ —— dw_base/datax/job_config_generator.py 配置生成单测pytest(待加入 requirements.txt)pyspark==2.4.0(已在 requirements.txt,版本对齐 CDH 6.3.2 parcel;集群运行时 HMS 通过 SPARK_CONF_DIR=/etc/spark/conf 下的 hive-site.xml 加载)骨架(未启动)。本批仅建目录 + 本 README。
见 kb/90-重构路线.md 聚簇 D + §6。