大数据之-Hadoop3.x_MapReduce_区内排序案例---大数据之hadoop3.x工作笔记0117

最新推荐文章于 2023-03-27 21:06:06 发布

添柴程序猿

最新推荐文章于 2023-03-27 21:06:06 发布

阅读量535

点赞数

CC 4.0 BY-SA版权

分类专栏：集群&算法&量子计算文章标签： mapreduce big data 大数据

本文为博主原创文章，未经博主添柴程序猿允许不得转载违者追究法律责任。

本文链接：https://blog.youkuaiyun.com/lidew521/article/details/122106486

集群&算法&量子计算专栏收录该内容

259 篇文章 ¥9.90 ¥99.90

订阅专栏

超级会员免费看

本文介绍了如何使用Hadoop3.x的MapReduce进行分区排序，具体实现了一个需求，即根据手机号前缀将数据分成不同分区，并在每个分区内部按照总流量降序、上行流量升序排序。通过创建自定义分区类`ProvincePartitioner2`，并设置分区数和任务，成功实现了预期的分区和排序效果。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

然后我们继续看,上一节,我们用二次排序,对,按照总流量倒序的基础上,如果总流量一样,我们

按照上行流量的升序又排序了一下,然后,这一次我们又有了新的需求,我们希望,

我们136开头的,放到一个分区文件中去,137开头的,放到一个文件中去,138开头的手机号,放到一个

分区文件中去,139的放到一个分区文件中去,然后其他的开头的,放到一个分区文件中去,这样怎么弄?

并且我们要求,每个结果文件的,内部都是有序的对吧.

我们去实现一下,首先我们去新建一个包,

partitionerandwritableComparable这个包

然后我们把之前的writableComparable的包中的程序文件,都copy过来,这样少写一些代码

了解本专栏

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

添柴程序猿 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。