Hive QL解题流程详解二

本文详细解析了使用Hive QL解决数据仓库中的两个实际问题:一是统计京东店铺的UV和访问次数排名前三的访客;二是分析订单数据,包括每月订单数、用户数和总金额,以及2017年11月的新客数量。通过建表和查询操作,展示了Hive在大数据处理中的应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

第3题

有50W个京东店铺,每个顾客访客访问任何一个店铺的任何一个商品时都会产生一条访问日志,访问日志存储的表名为Visit,访客的用户id为user_id,被访问的店铺名称为shop,请统计:

1)每个店铺的UV(访客数)

2)每个店铺访问次数top3的访客信息。输出店铺名称、访客id、访问次数

数据集

u1  a
u2  b
u1  b
u1  a
u3  c
u4  b
u1  a
u2  c
u5  b
u4  b
u6  c
u2  c
u1  b
u2  a
u2  a
u3  a
u5  a
u5  a
u5  a

1) 建表

create table visit(
user_id varchar(10),
shop varchar(20)
)

2) 每个店铺的UV(访客数)

分析:
需求是访客数,相同的访客应该进行去重,求店铺的访客数应该是按照店铺进行分组
​
select
shop,count(distinct user_id)
from visit
group by shop;

3) 每个店铺访问次数top3的访客信息。输出店铺名称、访客id、访问次数

分析:
1.求每个店铺被每个用户的访问次数
select
shop,user_id,count(*) ct
from visit
group by shop,user_id;t1

2.计算每个店铺被用户访问次数排名
select shop,user_id,ct,rank() over
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值