Hadoop入门(八)自定义类型实例-统计手机流量数据Demo

本文通过一个实例介绍如何使用Hadoop MapReduce处理业务需求,统计大量手机流量数据。具体操作中,定义自定义类型来处理数据,并以手机号作为Key,对特定字段的流量进行汇总。示例数据包含11个字段,目标是聚合相同手机号的6789字段流量。最后,将程序打包并在Hadoop环境中运行。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

业务需求:跟运营商后台数据,统计手机流量数据

下面是部分数据的截图:


我们把上面每一行数据抽象出来安“\t” 隔开出11个字段:


我们要统计相同手机号的,6789字段的手机流量汇总,实际中其实数据非常庞大,Demo中我们就以上面4条为例,进行试验。

分析:K我们可以确定就是手机号,类型Text,V包括4个字段(6,7,8,9),那我们把V自定义成一个新类型。

我们自定义一个类:

package test;
import java.io.DataInput;
import java.io.DataOutput;
import java.io.IOException;
import java.net.URI;
import java.net.URISyntaxE
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值