hadoop
u010020099
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
深入解析mapreduce中shuffle的工作原理
转发:https://blog.youkuaiyun.com/MrSaber/article/details/76934814 定义 shuffle:针对多个map任务的输出按照不同的分区(Partition)通过网络复制到不同的reduce任务节点上的过程。相应上图中红色框所圈的内容。 由图可见Shuffle过程横跨了map,reduce两端,所以为了方便讲解,我们在下面分为两个部分进行讲解...转载 2018-09-20 17:06:16 · 380 阅读 · 0 评论 -
MapReduce shuffle过程详解(二)
原文:https://blog.youkuaiyun.com/u014374284/article/details/49205885 一、MapReduce计算模型 我们知道MapReduce计算模型主要由三个阶段构成:Map、shuffle、Reduce。 Map是映射,负责数据的过滤分法,将原始数据转化为键值对;Reduce是合并,将具有相同key值的value进行处理后再输出新的键值对作为最终结果...转载 2018-09-20 17:28:02 · 224 阅读 · 0 评论
分享