
Hadoop
csdn_hnhk
从地狱到天堂,我路过人间。
展开
-
【Hadoop】Hive优化之——控制hive任务中的map数和reduce数
一、控制hive任务中的map数: 1.通常情况下,作业会通过input的目录产生一个或者多个map任务。 主要的决定因素有: input的文件总个数,input的文件大小,集群设置的文件块大小(目前为128M, 可在hive中通过setdfs.block.size;命令查看到,该参数不能自定义修改); 2.举例: a) 假设input目录下有1个文件a,大小为780M,那么原创 2016-08-19 16:27:39 · 662 阅读 · 0 评论 -
【Hive】Hive参数
Hive 参数 hive.exec.max.created.files •说明:所有hive运行的map与reduce任务可以产生的文件的和 •默认值:100000 hive.exec.dynamic.partition •说明:是否为自动分区 •默认值:false hive.mapred.reduce.tasks.speculative.execution •说明:是否打开推测原创 2017-07-04 17:39:05 · 393 阅读 · 0 评论