Hadoop-MapReduce-Combiners

本文详细介绍了Hadoop MapReduce框架中Combiners的作用及其工作原理。通过使用Combiners,可以有效地减少Map任务输出到Reduce任务的数据量,从而提高整体处理效率。文章通过具体示例展示了Combiners如何在Map阶段对数据进行本地聚合。

Hadoop-MapReduce-Combiners

Combiners的作用:
combiners是对Map的每次输出进行合并,然后传给Reduce,从而减少Map输出到Reduce的输出量,提升效率。
combiners是对每个map的输出进行一次合并,例如
Map1:(1997,20),(1997,10),(1997,50)
Map2:(1997,1),(1997,2),(1997,3)
经过Combiners 合并后:
Map1:(1997,[20,10,50])
Map2:(1997,[1,2,3])
通过使用Combiners使Map先输出的在本地先聚合,这样会提升速度。
Combiners的输出是Reduce的输入,但是Combiners不能影响最终的结果。
举例:求最大的温度
Map1:(1997,20),(1997,10),(1997,50)
Map2:(1997,1),(1997,2),(1997,3)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值