马克-to-win @ 马克java社区:map 端做join和reduce端做join有何区别?我们前面讲的是Reduce端join,因为Reduce端join需要把所有的数据都经过 Shuffle,非常消耗资源,效率要远远低于Map端join。Map端join是指只有map工作,reduce不工作,这样可以有效的避免数据倾 斜。
更多请见:https://blog.youkuaiyun.com/qq_44594249/article/details/96722942
马克-to-win在马克java社区探讨了map端做join和reduce端做join的区别。Reduce端join需将所有数据经过Shuffle,消耗资源大、效率低;而Map端join只有map工作,可有效避免数据倾斜。
马克-to-win @ 马克java社区:map 端做join和reduce端做join有何区别?我们前面讲的是Reduce端join,因为Reduce端join需要把所有的数据都经过 Shuffle,非常消耗资源,效率要远远低于Map端join。Map端join是指只有map工作,reduce不工作,这样可以有效的避免数据倾 斜。
更多请见:https://blog.youkuaiyun.com/qq_44594249/article/details/96722942
1521
273
830
2129

被折叠的 条评论
为什么被折叠?