bin/spark-submit --master spark://master.hadoop:7077,slave1.hadoop:7077 --executor-memory 512mb --total-executor-cores 4
--class nuc.sw.test.ScalaWordCount /root/spark-1.0.jar hdfs://master.hadoop:9000/input hdfs://master.hadoop:9000/output
解释:
bin/spark-submit
--master 指定master的位置如果有多个任务,用逗号分隔。spark://master.hadoop:7077,slave1.hadoop:7077
--executor-memory 指定运行时候的内存 512mb(每个机器上)
--total-executor-cores 指定核数(整个任务总共的核数)
--class 指定main方法的类名 jar包的路径 输入路径 输出路径

本文介绍了bin/spark-submit命令的使用,包括指定master位置、运行内存、核数等参数。如通过--master指定多个任务的master位置,用逗号分隔;--executor-memory指定每个机器上的运行内存;--total-executor-cores指定整个任务的核数等。
546

被折叠的 条评论
为什么被折叠?



