理解以下选项
-files <comma separated list of files> specify comma separated files to be copied to the map reduce cluster:缓存文件到HDFS
-libjars <comma separated list of jars> specify comma separated jar files to include in the classpath.缓存jar包到classpath
-archives <comma separated list of archives> specify comma separated archives to be unarchived on the compute machines.:缓存压缩包到classpath
-D mapred.reduce.tasks=10
-D mapred.map.tasks=200
设定reduce任务的数量
-D mapred.map.max.attempts
-D mapred.reduce.max.attempts
-D mapred.reduce.tasks.speculative.execution=true
-D mapred.map.tasks.speculative.execution=true
是否设定推测执行
-D mapred.tasks.timeout=600
默认等待每个Map任务时间是10分钟,10分钟后没有反馈,任务任务失败,设置为0是表示关闭这个特性。
-D stream.map.input.ignoreKey=False : map过程中只产生value,节省IO
-D stream.map.input=rawbytes
-D stream.map.output=rawbytes
-D stream.reduce.input=rawbytes
-D stream.reduce.output=rawbytes
-D stream.tmpdir=/tmp/streaming :streaming :使用的临时目录
-D mapreduce.task.classpath.user.precedence=true :classpath的优先级,设定为用户自定义jar包优先