Spark参数调优需要对各个参数充分理解,没有一套可以借鉴的参数,因为每个集群规模都不一样,只有理解了参数的用途,调试出符合自己业务场景集群环境,并且能在扩大集群、业务的情况下,能够跟着修改参数才算是正确的参数调优。
本系列文章仅为个人理解与观点,如果任何地方有疑问与错误,欢迎评论指正!
(上次更新时间---2018-09-05 15:07)
1、背景
Spark2.2.1版本(现升级到了2.3.1版本),其实官方文档中,相关的参数已经写的很详细了,这边仔细阅读了官方文档,
并结合了实际情景,实践之后,整理了这篇博客。
官方文档:
http://spark.apache.org/docs/2.2.1/configuration.html
yarn:
http://spark.apache.org/docs/2.2.1/running-on-yarn.html#configuration
2、参数详解
① Application Properties 应用基本属性
https://blog.youkuaiyun.com/zyzzxycj/article/details/82255979
② Runtime Environment 运行环境