Hive两小案例

本文提供了两个Hive实战案例。第一题涉及用户访问数据的统计,通过Hive SQL计算每个用户的累积访问次数。第二题是京东店铺的访问日志分析,包括计算每个店铺的唯一访客数(UV)以及访问次数最多的前三个访客信息。通过创建表、加载数据及使用分组、窗口函数等进行数据处理。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Hive案例

第1题

我们有如下的用户访问数据

userId visitDate visitCount
u01 2017/1/21 5
u02 2017/1/23 6
u03 2017/1/22 8
u04 2017/1/20 3
u01 2017/1/23 6
u01 2017/2/21 8
u02 2017/1/23 6
u01 2017/2/22 4

要求使用SQL统计出每个用户的累积访问次数,如下表所示:

用户id 月份 小计 累积
u01 2017-01 11 11
u01 2017-02 12 23
u02 2017-01 12 12
u03 2017-01 8 8
u04 2017-01 3 3

数据:

u01 2017/1/21 5

u02 2017/1/23 6

u03 2017/1/22 8

u04 2017/1/20 3

u01 2017/1/23 6

u01 2017/2/21 8

u02 2017/1/23 6

u01 2017/2/22 4

  1. 创建table,加载数据

    create tbale action(
     userId string,visitDate     string ,visitCount   int 
    )
    row format delimited fields terminated by '\t';
    load data local inpath '/opt/module/datas/viste.txt' into table action;
    
  2. 分析原表中的数据以及结果输出的表数据,发现visitDate字段需要进行格式转换以及分割,格式转换联想到date_format函数,

    select action.userid ,date_format(regexp_rep(action.visitDate,'/','-'),'yyyy-MM') date_dt,action.visitCount  from 
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值