Spark参数调优详解目录

本文档详细介绍了Spark 2.2.1版本(已更新到2.3.1)的参数调优,包括Application Properties、Runtime Environment、Shuffle Behavior等多个方面。作者通过深入研究官方文档并结合实际应用,提供了各个参数的解释与实践建议,旨在帮助读者理解和优化自己的Spark集群。同时,文章包含了对Spark UI、Compression和Serialization、Memory Management等多个关键领域的深入探讨。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Spark参数调优需要对各个参数充分理解,没有一套可以借鉴的参数,因为每个集群规模都不一样,只有理解了参数的用途,调试出符合自己业务场景集群环境,并且能在扩大集群、业务的情况下,能够跟着修改参数才算是正确的参数调优。

本系列文章仅为个人理解与观点,如果任何地方有疑问与错误,欢迎评论指正!

(上次更新时间---2018-09-05 15:07)

1、背景

Spark2.2.1版本(现升级到了2.3.1版本),其实官方文档中,相关的参数已经写的很详细了,这边仔细阅读了官方文档,

并结合了实际情景,实践之后,整理了这篇博客。

官方文档:

http://spark.apache.org/docs/2.2.1/configuration.html

yarn:

http://spark.apache.org/docs/2.2.1/running-on-yarn.html#configuration

 

2、参数详解

① Application Properties 应用基本属性

https://blog.youkuaiyun.com/zyzzxycj/article/details/82255979

② Runtime Environment 运行环境

https://blog.csdn.n

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值