Hive 分组group by后取top-k
首先需要了解一下rank函数,这个函数有啥用呢?就是可以另外生成一列,内容是每一行的编号先看一下咱的表长啥样select * from student;然后用rank函数# 还能根据age排序select *, rank() over (order by age) from student;了解完rank的用法后,新的问题是:在group by后的每个组都单独进行编号(比如成绩按日期dt分组,然后再排序)在over’中加入parition即可,这里给出语法,场景就不解释了select
原创
2022-05-22 10:26:54 ·
846 阅读 ·
0 评论