hive-SQL学习笔记11

本文介绍了如何使用Hive SQL找出特定时间段内用户的最大停留时长及其相关记录。通过按user_id和time排序,结合row_number()函数,确保数据正确排序,并通过限制结果只取最大值一行,提供了两种不同的解决方案。文章还提到了在处理时间字段时需要注意的字符串与浮点数排序差异。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

之前有人问我,如何挑出一个月的最大值及其特征,比如有三列,分别是user_id,item_id,time,其中time是停留时长,这个问题就是找出这个用户,他这一行是什么,我当时就懵逼了。我说我直接全部拉下来这个月的数据,然后py操作取最大值即可。。。game over

For Recommendation in Deep learning QQ Group 277356808

For deep learning QQ Second Group 629530787

I'm here waiting for you

下面分步进行,逐渐加深

1-按照time来排序获取一定时间内的点击曝光日志,从小到大的排序

既然是排序,那么肯定是用ORDER BY,如下是简单的按照单列(time)排序

SELECT user_id,item_id,time  
FROM ClickLogTable 
WHERE concat(datetime, dayhour) be
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

小李飞刀李寻欢

您的欣赏将是我奋斗路上的动力!

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值