
hive
zcc_0015
业精于勤,荒于嬉
展开
-
hivesql中对decimal的注意事项
hive sql, decimal原创 2023-02-08 18:51:54 · 584 阅读 · 0 评论 -
hive sort_array实现字符串从大到小排序的方法
sort_array默认是从小到大排序的,为了实现能够从大到小排序,需要做两个变换: (1)将字符串映射成数字:ROW_NUMBER() OVER(PARTITION BY user_id, cate_level1ORDER BY date desc) (2)基于数字保持大小序映射到小数:1-1/rnk(采用sigmoid变换会存在一个问题:当数字大于36以后,几乎都等于1.0,无法区分大小,对于小于36以下的数字管用) (3)添加辅助列,置于串头排序后,借助于REGEXP_REPLACE做替换,..原创 2021-04-06 13:47:15 · 8304 阅读 · 0 评论 -
hive的rownumber和group by区别
1、row_number() over()排序功能: (1) row_number() over()分组排序功能: 在使用 row_number() over()函数时候,over()里头的分组以及排序的执行晚于 where group by order by 的执行。 partition by 用于给结果集分组,如果没有指定那么它把整个结果集作为一个分组,它和聚合函数不同的地方...原创 2018-09-21 17:28:05 · 5096 阅读 · 0 评论