select * from (select *,row_number() over (PARTITION BY col1,col2,col3 ORDER BY col4 desc) rank from df1) tmp where rank<=10
这个是提取前10的数据
SPARKSQL中分组排序并提取前N行
最新推荐文章于 2023-12-11 09:36:51 发布
本文解析如何使用SQL的ROW_NUMBER()函数和PARTITION BY/ORDER BY语句,从df1表中按col1, col2, col3字段分组并降序排列,获取排名小于等于10的顶级数据。
1125

被折叠的 条评论
为什么被折叠?



