一:背景
求最值是MapReduce的常见算法,应用也很广泛,比如说求出某大型销售网站各个站点销售量最大的商品,人口最多的城市等等,MapReduce求最大值的关键是要实现cleanUp()方法。
二:技术实现
#需求 有两个文件max和max2,现要求合并两个并找出最大值。
#max文件数据如下:
10
29
50
39
88
99
29
100
389
#max2文件数据如下:
10
20
39
90
33
299
99
390
900
999
22
实现代码如下:
public class MaxTest {
// 定义输入路径
private static final String INPUT_PATH = "hdfs://liaozhongmin:9000/max_file/*";
// 定义输出路径
private static final String OUT_PATH = "hdfs://liaozhongmin:9000/out";
public static void main(String[] args) {
try {
// 创建配置信息
Confi