目录
一、Hive 中row_number()函数介绍
二、使用示例
三、总结
四、附录
在Oracle中,我们经常会用到row_number() over(partition by clo1 order by clo2 desc) 方法来取表中clo1 重复记录clo2最大的一条或几条记录,那在Hive上row_number()是否存在这个函数,其具体的用法是怎么样的呢?下面我们通过具体的示例来看下。
一、Hive 中row_number()函数介绍
Hive-0.11.0中内置row_number函数
org.apache.hadoop.hive.ql.exe.FunctionRegistry
registerHiveUDAFsAsWindowFunctions();
registerWindowFunction("row_number", new GenericUDAFRowNumber()); --row_number实现类
registerWindowFunction("rank", new GenericUDAFRank());
registerWindowFunction("dense_rank", new GenericUDAFDenseRank());
registerWindowFu