【Spark】Spark调优资源调优

最新推荐文章于 2024-11-29 17:17:53 发布

九师兄

最新推荐文章于 2024-11-29 17:17:53 发布

阅读量735

点赞数 1

CC 4.0 BY-SA版权

分类专栏：大数据-spark

本文为博主九师兄（QQ:541711153 欢迎来探讨技术）原创文章，未经允许博主不允许转载。

本文链接：https://blog.youkuaiyun.com/qq_21383435/article/details/80467942

大数据-spark 专栏收录该内容

204 篇文章 ¥49.90 ¥99.00

订阅专栏

本文详细介绍了Spark的内存模型，包括Executor内存的Execution、Storage和其他部分，并讨论了1.6.0版本前后的内存优化策略，如StaticMemoryManager和UnifiedMemoryManager。此外，还阐述了Spark的执行流程，并提供了资源调优的建议，如num-executors、executor-memory、executor-cores、driver-memory等参数的设置方法，以确保Spark作业高效运行。

文章目录

1 Spark内存模型
2.执行流程
3.资源调优

在这里插入图片描述

1 Spark内存模型

Spark在一个Executor的内存分为三块，

1. 一块是execution内存
2. 一块是Storge 内存
3. 一块是其他内存

执行内存是执行内存，加入，聚合都是在这部分内存中执行.shuffle的数据也会先缓存在这个内存中，满了再写入磁盘，能减少IO，其实地图过程也是在这个内存中执行的。
Storge内存是存储broadcast，cache，persist数据的地方
其他内存是程序执行时预留给自己的内存（执行代码的时候使用）

execution和Storage是Spark Executor中的内存大户，other占用内存相对较少很多。在Spark-1.6.0以前的版本，execution和Storage的内存是固定分配的，使用的参数spark.shuffle.memoryFraction（execution内存占用Executor总内存大小的的0.2默认值）和spark.storage.memoryFraction（Storage内存占Executor内存的0.6）,因为1。6。0以前这两块内存是相互隔离的，这导致了Executor的内存利用率不高，而且需要根据Application的具体情况，使用者自己可以调节这两个参数才能优化Spark的内存使用。在Spar

了解本专栏

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

九师兄 你的鼓励是我做大写作的动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。