clickhouse踩坑:row_number()函数结果和预期不一致

文章指出了Clickhouse更新的开窗函数row_number()存在数据块排序的陷阱,导致结果可能与预期不符。解决方案是通过GROUPBY子查询确保数据在内存中全局排序。这样可以得到正确的row_number()结果。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

千呼万唤始出来,clickhouse终于更新了开窗函数,赶紧用起来
但是row_number()刚用上,就测试发现不对了,后来到官网仔细一看,果然,数据还是在数据块上排序,不是在所有数据中排序的。
clickhouse 官网截图

可以参照我的另一篇讲neighbor函数的文章,意思是差不多的。
clickhouse踩坑:neighbor函数结果和预期不一致

只需要使用group by 函数等,将数据从各个数据块中提取到内存中即可

举个例子:

原SQL

 	select co1,col2
 	,row_number() over(PARTITION by col1  order by col2 desc)r1
	from table1
	settings allow_experimental_window_functions = 1
 

正确SQL:

 	select co1,col2
 	,row_number() over(PARTITION by col1  order by col2 desc)r1
	from 
	(
		select col1,col2 
		from table1 
		group by col1,col2
	)
	settings allow_experimental_window_functions = 1

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值