Spark性能调优之JVM调优 通过一张图让你明白以下四个问题 1.JVM GC机制,堆内存的组成 2.Spark的调优为什么会和JVM的调优会有关联?--因为Scala也是基于JVM运行的语言 3.Spark中OOM产生的原因 4.如何在JVM这个层面上来对Spark进行调优 补充: Spark程序运行时--JVM堆内存分配比例 RDD缓存的数据(0.6) 默认 对象_task运行时产生的(0.2) 默认 聚合内存_shuffle read拉来的数据(0.2) 默认 手动分配内存时,不能去调节task运行时的内存,可以去调节其他的RDD Memory OR Shuffle read_聚合内存来间接调节task运行内存