MapReduce和Yarn知识回顾

原创已于 2023-05-19 20:41:46 修改 · 82 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#mapreduce #大数据

于 2023-05-06 17:18:34 首次发布

MapReduce理论中，Map的数量增加能提升计算速度，但过多会导致资源浪费。它适合处理Map间关联度不大的数据，而不适合有强关联的数据。Map的逻辑切数据默认128M，MapReduce的Hdfs切块大小不可调。文章还探讨了MapReduce的底层工作原理。

一、MapReduce基础知识

理论上，Map数量越多，程序计算速度也会越快。但是到达一定量级时，就不能在增加了，否则会造成资源的浪费。（因为每次启动Map也需要消耗大量的计算机资源）。

适合MR的应用场景： MR适合进行计算一些各Map之间==关联度不大或者没有关联度的数据==。

不适合MR的应用场景：各Map之间==存在关联==的情况，==不适合使用MR==

MapReduce需要关注successful下面的输出日志:

二、MapReduce计算流程(天龙八步）

Map逻辑切数据默认128M，可以调；Hdfs12不可调。

三、MapReduce底层原理

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。