spark优化（一）--瓶颈分析

一只咸鱼va

已于 2023-02-21 10:36:16 修改

阅读量1k

点赞数 2

CC 4.0 BY-SA版权

分类专栏： spark 文章标签： spark 大数据分布式

于 2022-09-27 20:51:12 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/YYLong0/article/details/127078290

spark 专栏收录该内容

7 篇文章

订阅专栏

本文主要介绍了如何通过WebUI分析Spark作业性能瓶颈的方法，包括如何定位慢速job和stage、观察shuffle情况、检查缓存使用及环境配置等，并进一步探讨了如何通过代码逻辑优化提升整体效率。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1.查看Web UI

job找出运行慢的job，方便定位代码块
stages 找出运行慢的stage，方便定位代码块，观察shuffle量，可跟踪具体log，看各个阶段运行时间
storage 缓存的大小是否在预期范围内，有时候过大的缓存也可能导致运行慢
environment 一般不需要看，查看参数时可以看
executor 观察是否有任务倾斜（大多数task集中在某个executor）和数据倾斜以及GC状况是否良好，以及查看Fail task的log
sql 查看sql的执行过程，输入输出及其大小。看是否存在优化的空间（比如hint 指定join的方式），具体问题具体分析

2.根据log信息大致定位慢的原因
logerr
3.查看代码块
通过上述步骤，大部分情况下我们可以找到是哪个job哪个stage的哪块代码（或者sql）运行的慢，此时我们需要进行初步排查，看代码逻辑是否合理
通常情况下，一个业务可以通过多种代码逻辑实现，当你接手别人的代码的时候，不应该是调整参数（比如盲目增大内存），而是应该要来业务文档和技术文档（没有？自己梳理吧），结合代码和文档梳理，当前代码是否为业务逻辑的最优解。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。