mapreduce共有八个步骤,map阶段2个步骤,shuffle阶段4个步骤,reduce阶段分为2个步骤
用InputFormat:TextInputFormat类将读取文件
K1是文本偏移量,V1是文本
Map:1.自定义Map逻辑,将K1和V1转为K2和V2
2.继承Mapper,重写map方法
得出的V2全固定为1,忽视重复值
将重复值组合,得出新的V2为<1,1,1>(表示出现3次)
Reduce:1.自定义Reduce逻辑,将K2和V2转为K3和V3
2.继承Reducer,重写reduce方法
将V2的<1,1,1>转为3的形式
用OutputFormat:TextOutputFormat类将结果存入一个普通文本文件