1、需求:
以下是博客的好友列表数据,冒号前是一个用户,冒号后是该用户的所有好友(数据中 的好友关系是单向的)求出哪些人两两之间有共同好友,及他俩的共同好友都有谁?
2、需求分析:
先求出 A、B、C、….等是谁的好友(如A是I,K,C,B,G,F,H,O,D的好友)
第一次输出结果
第二次输出结果(如A和B的共同好友有E、C)
......
3、代码实现:
3.1、第一次 Mapper
3.2、第一次 Reducer
3.3、第一次 Driver
第一次输出结果:
3.4、第二次 Mapper
第二次Mapper之后的数据是什么样?
将第二次Driver的Reduce设为:job.setNumReduceTasks(0);执行后发现输出结果如下:
3.5、第二次 Reducer
3.6、第二次 Driver
第二次MapReduce之后的结果如下: