row_number () over(partition by order by) 在 impala 和 hive 中的对NULL排序的问题

本文讨论了在Impala和Hive中处理NULL值排序的方法。由于NULL在不同数据库中有不同的默认排序方式,在Impala中被视为最大值而在Hive中被视为最小值,这可能导致SQL查询结果不一致。文章提供了一种解决方案,即通过新增一个排序辅助字段来统一处理NULL值。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

今天遇到一个排序的问题,NULL值,在impala中按顺序排列的话,NULL是按最大值的排序;

在hive中NULL是按最小值排序的;

以导致写的sql出来结果和预想的不一致,查了相关资料,发现hive中没有,类似oracle  row_number () over(partition by order by  NULLS last)  这种写法;

解决办法:新增一个字段  case when 字段 is null then 1 else 0 end as paixu,然后排序的时候,先按照这个字段排序;

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值