133、Spark核心编程进阶之yarn模式相关参数详解

属性名称默认值含义
spark.yarn.am.memory512mclient模式下,YARN Application Master使用的内存总量
spark.yarn.am.cores1client模式下,Application Master使用的cpu数量
spark.driver.cores1cluster模式下,driver使用的cpu core数量,driver与Application Master运行在一个进程中,所以也控制了Application Master的cpu数量
spark.yarn.am.waitTime100scluster模式下,Application Master要等待SparkContext初始化的时长; client模式下,application master等待driver来连接它的时长
spark.yarn.submit.file.replicationhdfs副本数作业写到hdfs上的文件的副本数量,比如工程jar,依赖jar,配置文件等,最小一定是1
spark.yarn.preserve.staging.filesfalse如果设置为true,那么在作业运行完之后,会避免工程jar等文件被删除掉
spark.yarn.scheduler.heartbeat.interval-ms3000application master向resourcemanager发送心跳的间隔,单位ms
spark.yarn.scheduler.initial-allocation.interval200msapplication master在有pending住的container分配需求时,立即向resourcemanager发送心跳的间隔
spark.yarn.max.executor.failuresexecutor数量*2,最小3整个作业判定为失败之前,executor最大的失败次数
spark.yarn.historyServer.addressspark history server的地址
spark.yarn.dist.archives每个executor都要获取并放入工作目录的archive
spark.yarn.dist.files每个executor都要放入的工作目录的文件
spark.executor.instances2默认的executor数量
spark.yarn.executor.memoryOverheadexecutor内存10%每个executor的堆外内存大小,用来存放诸如常量字符串等东西
spark.yarn.driver.memoryOverheaddriver内存7%同上
spark.yarn.am.memoryOverheadAM内存7%同上
spark.yarn.am.port随机application master端口
spark.yarn.jarspark jar文件的位置
spark.yarn.access.namenodesspark作业能访问的hdfs namenode地址
spark.yarn.containerLauncherMaxThreads25application master能用来启动executor container的最大线程数量
spark.yarn.am.extraJavaOptionsapplication master的jvm参数
spark.yarn.am.extraLibraryPathapplication master的额外库路径
spark.yarn.maxAppAttempts 提交spark作业最大的尝试次数
spark.yarn.submit.waitAppCompletiontruecluster模式下,client是否等到作业运行完再退出
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值