黑猴子的家：数据倾斜&Distributedcache

最新推荐文章于 2022-08-11 19:02:59 发布

黑猴子的家

最新推荐文章于 2022-08-11 19:02:59 发布

阅读量146

点赞数

CC 4.0 BY-SA版权

分类专栏： MapReduce

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/qq_28652401/article/details/83508000

MapReduce 专栏收录该内容

50 篇文章

订阅专栏

本文深入探讨了MapReduce中数据倾斜的原因及其实操案例，并提出了解决方案，通过在map端缓存多张表来平衡任务负载，减少数据倾斜，提高资源利用率。介绍了使用distributedcache的具体办法。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1、数据倾斜原因

如果是多张表的操作都是在reduce阶段完成，reduce端的处理压力太大，map节点的运算负载则很低，资源利用率不高，且在reduce阶段极易产生数据倾斜。

2、实操案例：

数据倾斜案例续写

3、解决方案

在map端缓存多张表，提前处理业务逻辑，这样增加map端业务，减少reduce端数据的压力，尽可能的减少数据倾斜。

4、具体办法：采用distributedcache

（1）在mapper的setup阶段，将文件读取到缓存集合中
（2）在驱动函数中加载缓存。
// 缓存普通文件到task运行
job.addCacheFile(new URI("file:/e:/mapjoincache/pd.txt"));节点

5、实操案例

distributedcache案例续写..

黑猴子的家

博客等级

码龄10年

1545
原创

190
点赞

726
收藏

458
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: 黑猴子的家：Combiner合并

下一篇：: 黑猴子的家：ReduceTask工作机制

最新评论

黑猴子的家：华为 OpenEuler-20.03-LTS 配置UKUI图形化界面
cqwuliu: 远程有界面吗
黑猴子的家：Centos 7.x gcc 4.8.5 升级到 gcc 4.9.4
m0_75017410: make install也是报错。 [root@localhost build]# make install make[1]: 进入目录“/root/software/gcc-4.9.0/build” /bin/sh ../mkinstalldirs /usr/local /usr/local make[2]: 进入目录“/root/software/gcc-4.9.0/build/fixincludes” make[2]: *** 没有规则可以创建目标“install”。停止。 make[2]: 离开目录“/root/software/gcc-4.9.0/build/fixincludes” make[1]: *** [install-fixincludes] 错误 2 make[1]: 离开目录“/root/software/gcc-4.9.0/build” make: *** [install] 错误 2 [root@localhost build]#
黑猴子的家：Centos 7.x gcc 4.8.5 升级到 gcc 4.9.4
m0_75017410: 为什么 make -j4后会出现以下情况。 ranlib .libs/libgmp.a rm -fr .libs/libgmp.lax creating libgmp.la (cd .libs && rm -f libgmp.la && ln -s ../libgmp.la libgmp.la) make[5]: 离开目录“/root/software/gcc-4.9.0/build/gmp” make[4]: 离开目录“/root/software/gcc-4.9.0/build/gmp” make[3]: 离开目录“/root/software/gcc-4.9.0/build/gmp” make[2]: 离开目录“/root/software/gcc-4.9.0/build” make[1]: *** [stage1-bubble] 错误 2 make[1]: 离开目录“/root/software/gcc-4.9.0/build” make: *** [all] 错误 2 [root@localhost build]#
黑猴子的家：Centos 7.x gcc 4.8.5 升级到 gcc 4.9.4
ironSid: 得到子目录是吗
黑猴子的家：Centos 7.x gcc 4.8.5 升级到 gcc 4.9.4
MoXiaoJie_55: me too

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。