MapReduce过程

本文介绍了MapReduce的基本工作流程,包括map阶段和reduce阶段的具体步骤。map阶段涉及输入文件的读取、解析、map函数的应用、分区及排序等;reduce阶段则负责接收map阶段的输出、合并、排序以及执行用户定义的reduce函数。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

MapReduce由两个阶段组成,map阶段和reduce阶段:

map阶段:

1.从hdfs上读取文件,将文件的每一行解析成一个<K,V>对。

2.对解析后的<K,V>对执行用户实现的map函数。

3.对2所得结果进行分区。分区过程将在接下来学习Partitioner

4.对不同分区中的数据进行排序和分组。

5.(可选)对每个组的数据进行本地合并。该过程接下来学习Combiner

reduce过程:

1.对于map阶段的输出结果,通过网络发送到reduce节点。

2.对map阶段的多个map节点的输出进行合并、排序,执行用户实现的reduce函数。

3.将输出结果写到hdfs上。

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值