第1关:spark-submit提交
任务描述
本关任务:学会将程序提交到集群上执行。
相关知识
为了完成本关任务,你需要掌握:1.了解spark-submit的参数。2.学会提交Spark程序在集群运行。
课程视频《spark-submit提交》
spark-submit参数
参 数 介 绍
–master 提交到哪里执行,如 standalone,local,yarn,mesos等
–name 应用程序的名称
–class 应用程序的主类
–deploy-mode Driver 程序运行的地方,client 或者 cluster,默认是client
–driver-memory Driver内存,默认 1G
–executor-memory 每个executor的内存,默认是1G
使用格式:
./bin/spark-submit
–class
–master
–deploy-mode
–conf
… # other options
application-jar
计算圆周率
cd /opt/spark/dist/bin
./spark-submit
–master local
–class org.apache.spark.examples.SparkPi
/opt/spark/dist/examples/jars/spark-examples_2.11-2.2.0.jar
./spark-submit --master 本地模式 --class