【Spark】Spark调优 资源调优

本文详细介绍了Spark的内存模型,包括Executor内存的Execution、Storage和其他部分,并讨论了1.6.0版本前后的内存优化策略,如StaticMemoryManager和UnifiedMemoryManager。此外,还阐述了Spark的执行流程,并提供了资源调优的建议,如num-executors、executor-memory、executor-cores、driver-memory等参数的设置方法,以确保Spark作业高效运行。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >


在这里插入图片描述

1 Spark内存模型

Spark在一个Executor的内存分为三块,

1. 一块是execution内存
2. 一块是Storge 内存
3. 一块是其他内存
  1. 执行内存是执行内存,加入,聚合都是在这部分内存中执行.shuffle的数据也会先缓存在这个内存中,满了再写入磁盘,能减少IO,其实地图过程也是在这个内存中执行的。
  2. Storge内存是存储broadcast,cache,persist数据的地方
  3. 其他内存是程序执行时预留给自己的内存(执行代码的时候使用)

execution和Storage是Spark Executor中的内存大户,other占用内存相对较少很多。在Spark-1.6.0以前的版本,execution和Storage的内存是固定分配的,使用的参数spark.shuffle.memoryFraction(execution内存占用Executor总内存大小的的0.2默认值)和spark.storage.memoryFraction(Storage内存占Executor内存的0.6),因为1。6。0以前这两块内存是相互隔离的,这导致了Executor的内存利用率不高,而且需要根据Application的具体情况,使用者自己可以调节这两个参数才能优化Spark的内存使用。在Spar

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

九师兄

你的鼓励是我做大写作的动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值