1)mapping的过程就是把原始数据读成key,value对的形式
2)reducer的过程就是把mapping的键值对计算成为我们最终我们想要的数据
3)shuffle的定义是:把key相同的行聚合到一起,形成一个{key, [value的数组]}这种形式
2)reducer的过程就是把mapping的键值对计算成为我们最终我们想要的数据
3)shuffle的定义是:把key相同的行聚合到一起,形成一个{key, [value的数组]}这种形式
来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/26097185/viewspace-1199097/,如需转载,请注明出处,否则将追究法律责任。
转载于:http://blog.itpub.net/26097185/viewspace-1199097/