spark-tuning.conf 1.1 KB

1234567891011121314151617181920212223
  1. # Spark 业务调优参数(原生格式:key value,# 注释,空白分隔)
  2. # 本文件收录资源/并行度/队列类参数,新业务落地早期会频繁调整以找到合适默认值。
  3. # 底层行为/开关类参数见 conf/spark-defaults.conf。
  4. # 加载入口:dw_base/spark/spark_sql.py 构造 SparkSession 前加载(在 spark-defaults.conf 之后,相同 key 覆盖 defaults)
  5. # 覆盖规则:L1 spark-defaults.conf + 本文件 < L2 SQL 内 SET < L3 构造函数显式传参 / extra_spark_config
  6. # Driver
  7. spark.driver.cores 2
  8. spark.driver.memory 2g
  9. spark.driver.maxResultSize 4g
  10. # Executor
  11. spark.executor.cores 2
  12. spark.executor.instances 15
  13. spark.executor.memory 6g
  14. spark.executor.memoryOverhead 512
  15. # 并行度 / Shuffle
  16. spark.default.parallelism 200
  17. spark.sql.shuffle.partitions 200
  18. # YARN 队列
  19. spark.yarn.queue spark