
HIve
Distrlili
这个作者很懒,什么都没留下…
展开
-
Hive- 序列函数
数据集如下:cookie1,2015-04-10,1cookie1,2015-04-11,5cookie1,2015-04-12,7cookie1,2015-04-13,3cookie1,2015-04-14,2cookie1,2015-04-15,4cookie1,2015-04-16,4cookie2,2015-04-10,2cookie2,2015-04-11,3cook...转载 2019-06-20 14:30:22 · 3452 阅读 · 0 评论 -
Hive - 聚合函数+ 窗口函数
1.partition by 定义的分组,具有累计的功能,会返回每个组中的成员 。另外partition by字句的优点是:在同一个select语句中,一个窗口函数的计算独立于按其他列分区的其他窗口函数的计算。当在窗口函数over字句中使用order by 字句时,就指定了两件事:1、分区中的行如何排序2、在计算时对哪些行进行累计1、创建表create database if not ...转载 2019-06-20 13:56:15 · 1765 阅读 · 0 评论 -
Hive 基础(-)
1.Hive创建表 - 默认创建外部表create table student (id int,name string, sex string, age int, department string ) row format delimited fields terminated by ",";关键字ROW FORMAT DELIMITED指定表的分隔符,通常后面要与以下关键...转载 2019-06-20 11:27:00 · 543 阅读 · 0 评论 -
Hive查询函数 (二)
1、汇总统计函数count() : 个数统计函数collect_set :集合去重数, 语法: collect_set (col), 将 col 字段进行去重,合并成一个数组。collect_list :集合不去重函数2、表格生成函数explode:数组拆分成多行,语法: explode(ARRAY),返回值: 多行说明: 将数组中的元素拆分成多行显示3、Map 拆分成多行,语法:...转载 2019-06-20 11:50:55 · 619 阅读 · 0 评论