
hive
文章平均质量分 62
Happybigman
如果好就拼命去努力,如果不好就随遇而安。
展开
-
sql常用函数
1、2、3、原创 2020-10-31 22:46:58 · 259 阅读 · 0 评论 -
Hive实现数据抽样的常用三种方法
背景在大规模数据量的数据分析及建模任务中,往往针对全量数据进行挖掘分析时会十分耗时和占用集群资源,因此一般情况下只需要抽取一小部分数据进行分析及建模操作。Hive提供了数据取样(SAMPLING)的功能,能够根据一定的规则进行数据抽样,目前支持数据块抽样,分桶抽样和随机抽样,具体如下所示:1、随机抽样(rand()函数)(1)使用rand()函数进行随机抽样,limit关键字限制抽样...原创 2018-11-15 10:21:55 · 9579 阅读 · 1 评论 -
Hive分析窗口函数 GROUPING SETS、GROUPING__ID、CUBE和ROLLUP
概述GROUPING SETS,GROUPING__ID,CUBE,ROLLUP这几个分析函数通常用于OLAP中,不能累加,而且需要根据不同维度上钻和下钻的指标统计,比如,分小时、天、月的UV数。数据准备2015-03,2015-03-10,cookie12015-03,2015-03-10,cookie52015-03,2015-03-12,cookie72015-04,2...原创 2019-08-28 16:45:02 · 261 阅读 · 0 评论