ROW_NUMBER()与FIRST_VALUE(url)区别(取首次记录)

这篇博客介绍了在Hive中如何使用ROW_NUMBER()和FIRST_VALUE()函数来获取分组内的首次记录。文章通过示例展示了这两个函数的区别,ROW_NUMBER()能获取整个序列的首次记录,而FIRST_VALUE()仅能取到第一个字段的值。内容包括具体的SQL查询语法和使用场景。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

工作中经常会遇到一次时间可以进行多次更改的情况,每次更改都会生成一条记录。那么如果想要取第一条数据的情况下,可以使用函数来解决。
hive函数取首次数据:
1.FIRST_VALUE
取分组内排序后,截止到当前行,第一个值(弊端:只能取到第一个字段)
select distinct wo_id,first_value(created_at) over(partition by wo_id order by id asc) as change_appoint_time_fir
from ods.ods_mall_swo_operate_log
where dt=‘2019-07-31’ and type=‘CH_SW_APPOINT’ and wo_id=‘346617364164486041’

2.ROW_NUMBER()
适用性比较强,能够取得一整段,比如我第一次到店是北京,第二次上海,使用这个函数就可以。
select wo_id,created_at as change_appoint_time_fir from (
select wo_id,created_at,ROW_NUMBER() over(partition by wo_id order by id ) as rn
from ods.ods_mall_swo_operate_log
where dt=‘2019-07-31’ and type=‘CH_SW_APPOINT’)ga where rn=1 AND wo_id=‘346622775823278114’

语法:

SELECT cookieid,
createtime,
url,
ROW_NUMBER() OVER(PARTITION BY cookieid ORDER BY createtime) AS rn,
FIRST_VALUE(url) OVER(PARTITION BY cookieid ORDER BY createtime) AS first1 
FROM test

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值