大数据学习(07)--MapReduce

目录

1.MapReduce介绍

1.1 什么是分布式并行编程?

在这里插入图片描述

传统的并行计算框架:cuda,MPI,OPENMP等等
参考博客

1.2 MapReduce模型介绍

在这里插入图片描述

1.3 map和reduce函数

在这里插入图片描述

结合操作:对键相同的数据的值进行相加
归并操作:对键相同的数据的值组合成一个数组

2.MapReduce体系架构

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

3.MapReduce工作流程

3.1 概述

在这里插入图片描述

3.2 MapReduce各个阶段介绍

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

3.3 shuffle过程介绍

3.3.1 shuffle过程简介

在这里插入图片描述

3.3.2 map中的shuffle过程

在这里插入图片描述

3.3.3 reduce中的shuffle过程

在这里插入图片描述

3.3.4 MapReduce应用程序执行过程

在这里插入图片描述

map和reduce执行过程中产生的数据都是存储在其本地计算机内部,这样可以避免频繁的通信造成的延迟和不必要的错误。

4.MapReduce具体应用

4.1 wordCount

4.1.1 程序的任务

在这里插入图片描述

4.1.2 设计思路

在这里插入图片描述

只要问题可以满足分治的思想解决的,都可以使用MapReduce程序解决
在这里插入图片描述

4.1.3 执行过程

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

4.2 关系表的自然连接

在这里插入图片描述
在这里插入图片描述

5.MapReduce编程实践

参考博客

5.1 任务

在这里插入图片描述

5.2 编写map处理逻辑

在这里插入图片描述

5.3 编写reduce处理逻辑

在这里插入图片描述
在这里插入图片描述

5.4 编写main方法

在这里插入图片描述
完整代码
在这里插入图片描述
在这里插入图片描述

5.5 打包编译程序

在这里插入图片描述

5.6MapReduce中执行MapReduce其他方法

在这里插入图片描述

6.总结

在这里插入图片描述

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值