MapReduce和Yarn知识回顾

MapReduce理论中,Map的数量增加能提升计算速度,但过多会导致资源浪费。它适合处理Map间关联度不大的数据,而不适合有强关联的数据。Map的逻辑切数据默认128M,MapReduce的Hdfs切块大小不可调。文章还探讨了MapReduce的底层工作原理。

一、MapReduce基础知识

        理论上,Map数量越多,程序计算速度也会越快。但是到达一定量级时,就不能在增加了,否则会造成资源的浪费。(因为每次启动Map也需要消耗大量的计算机资源)。

        适合MR的应用场景: MR适合进行计算一些各Map之间==关联度不大或者没有关联度的数据==。

        不适合MR的应用场景:各Map之间==存在关联==的情况,==不适合使用MR==

         MapReduce需要关注successful下面的输出日志:

二、MapReduce计算流程(天龙八步)

        Map逻辑切数据默认128M,可以调;Hdfs12不可调。

 

 

 三、MapReduce底层原理

 

 

 

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值