大数据之-Hadoop3.x_MapReduce_编程规范---大数据之hadoop3.x工作笔记0086

添柴程序猿

于 2021-07-05 20:50:53 发布

阅读量264

点赞数

CC 4.0 BY-SA版权

分类专栏：集群&算法&量子计算文章标签： mapreduce spark 大数据 hadoop

本文为博主原创文章，未经博主添柴程序猿允许不得转载违者追究法律责任。

本文链接：https://blog.youkuaiyun.com/lidew521/article/details/118497775

集群&算法&量子计算专栏收录该内容

259 篇文章 ¥9.90 ¥99.90

订阅专栏

超级会员免费看

本文详细介绍了在Hadoop3.x中编写MapReduce程序的规范，包括Mapper和Reducer的实现，以及MapTask和ReduceTask的工作过程。Mapper类需要继承Hadoop提供的基类，输入为k,v对，业务逻辑在map方法中处理。Reducer同样继承Reducer类，输入是Mapper的输出，业务逻辑在reduce方法中执行。最后，Driver部分负责将整个程序提交给YARN集群进行计算。" 89207267,7265809,使用数位DP解决包含2018的数的数量,"['动态规划', '算法', '搜索算法', '编程问题', '数学']

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

然后我们再来看看,如果我们自己去写一个MapReduce的程序,我们应该注意一些什么,

首先如果我们要写一个Mapper的话

可以看到,首先我们自己写的Mapper这个类要继承hadoop提供的mapper类

然后对于Mapper的输入是k,v对的形式,什么意思,就是说,MapReduce处理的时候,map处理的输入是个

k,v对的形式的数据,输入的,比如:

spark hello 如果一行的数据是这样的话,根据下标,0是开始位置,s表示下标1,p表示下标2,a表示下标3,r表示下标4,k表示下标5,空格是下标6,

h是下标7.

0123456789

那么作为一个输入的数据,就是0

了解本专栏

超级会员免费看

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

添柴程序猿 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。