基于以下的失败过程,我们修改了数据文件再测试了一次,将tab分割改成了逗号“,”,相应的程序里面也进行了修改String[] splited = data.split(",");,再次运行,测试ok
数据文件
[root@master IMFdatatest]#hadoop dfs -cat /library/dataForMutipleSorting.txt
DEPRECATED: Use of this script to execute hdfs command is deprecated.
Instead use the hdfs command for it.
16/02/27 04:01:55 WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable
Spark,100
Hadoop,60
Kafka,95
Spark,99
Hadoop,65
Kafka,98
Spark,99
Hadoop,63
Kafka,97
[root@master IMFdatatest]#hadoop dfs -cat /library/outputdataForMutipleSorting8/part-r-00000
DEPRECATED: Use of this script to execute hdfs command is deprecated.
Instead use the hdfs command
本文详细记录了使用Hadoop MapReduce进行多维排序时遇到的问题及解决过程,包括数据文件格式错误导致的ArrayIndexOutOfBoundsException,以及如何通过随机数测试定位问题。经过修改,数据文件由tab分隔改为逗号分隔,程序成功运行并输出了预期的排序结果。
订阅专栏 解锁全文
1996

被折叠的 条评论
为什么被折叠?



