Hive
文章平均质量分 92
b1gx
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Hive 窗口函数
文章目录一、常见聚合操作1. sum、avg、min、max二、排序相关的窗口函数1. row_number2. rank3. dense_rank三、其它窗口函数1. NTILE2. cume_dist3. percent_rank4. LAG5. LEAD6. FIRST_VALUE7. LAST_VALUE四、增强聚合操作1. GROUPING SETS2. CUBE3. ROLLUP4. GROUPING__ID有ORDER BY子句时对窗口范围的定义(ROWS | RANGE) BETWEEN原创 2021-04-01 14:59:01 · 639 阅读 · 0 评论 -
Hive SQL 之 数据库
1、 Hive 中的数据库本质是一个目录,通常数据库保存在hive.metastore.warehouse.dir所指定的目录下,以.db为后缀,例如testDB.db,该数据库中的表以这个数据库目录的子目录存在。注:default这个数据库是hive默认的数据库,若不指定数据库,这默认使用该数据库。该数据库没有自己的目录,该数据库中定义的表以hive.metastore.warehouse....原创 2019-05-29 22:08:16 · 406 阅读 · 0 评论 -
Hive 基于 MySQL安装
安装MySQL下载MySQL找到对应的rpm-bundle.tar安装包下载即可,比如我下载的是mysql-5.7.27-1.el7.x86_64.rpm-bundle.tar检查原系统中的mariadb,并删除它rpm -qa|grep mariadbrpm -e mariadb-libs-1:5.5.56-2.el7.x86_64 --nodeps解压MySQL安装包t...原创 2019-09-04 09:25:08 · 207 阅读 · 0 评论 -
Hive之实现累加
一、需求有如下数据gifshow.com 2019/01/01 5yy.com 2019/01/01 4huya.com 2019/01/01 1gifshow.com 2019/01/20 6gifshow.com 2019/02/01 8yy.com 2019/01/20 5gifshow.com 2019/02/02 7需要得到的结果...原创 2019-09-21 10:10:22 · 4887 阅读 · 0 评论 -
Hive实现topN
一、需求查询每个产品top3的用户信息,初始数据表如下uid piduser9 euser2 auser14 euser6 buser12 a... ...... ...二、实现#每个产品对应的每个用户的浏览量select pid,uid,count(uid) as cnt from visit2 group by pid,uid order b...原创 2019-09-21 11:38:23 · 984 阅读 · 0 评论 -
Hive源码编译支持UDF
一、准备源码下载[hadoop@bigdata source]$ wget http://archive.cloudera.com/cdh5/cdh/5/hive-1.1.0-cdh5.15.1-src.tar.gz解压[hadoop@bigdata source]$ tar -zxvf hive-1.1.0-cdh5.15.1-src.tar.gz上传UDF到hive-1...原创 2019-09-29 09:28:20 · 139 阅读 · 0 评论
分享