mapreduce学习-设计思想和原理

本文深入探讨MapReduce的设计思想——分而治之,详细解析MapReduce的工作流程,包括MRv1和MRv2。讨论了mapper和reducer的角色,以及如何根据需求调整map和reduce任务的数量,以优化大数据处理效率。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

MapReduce设计思想及原理
mapreduce:一是软件框架,二是并行处理,三是可靠且容错,四是大规模集群,五是海量数据集
参考
参考:https://www.cnblogs.com/riordon/p/4605022.html
设计思想:分而治之,
mapper 负责分,分,将任务分为多个简单任务,简单任务就是1、相对于原任务要大大缩小,2、就近原则,相比移动数据,移动计算成本要低,计算会在数据就近的节点计算,3、任务可以并行。
Reducer负责对map阶段的结果进行汇总,至于需要多少个Reducer,用户可以根据具体问题,通过在mapred-site.xml配置文件里设置参数mapred.reduce.tasks的值,缺省值为1

MRv1工作流程:
1、打包程序,运行,
2、向jobtracker获取一个job id
3、JobClient得到Job ID后,将运行Job所需要的资源拷贝到共享文件系统HDFS中
4、资源准备完备后,JobClient向JobTracker提交Job。
5、jobtracker初始化job
6、初始化完成后,JobTracker从HDFS中获取输入splits(作业可以该启动多少Mapper任务)。
7、与此同时,TaskTracker不断地向JobTracker汇报心跳信息,并且

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值