Hive
蕾欧娜等等
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
窗口函数之LEAD,LAG, FIRST_VALUE, LAST_VALUE
这篇博客给大家介绍 Hive 中最常用的四个窗口函数,分别是:LEAD, LAG, FIRST_VALUE 以及 LAST_VALUE。FIRST_VALUE:取分组内排序后,截止到当前行,第一个值。LAST_VALUE:取分组内排序后,截止到当前行,最后一个值。LEAD (col, n, default):用于统计窗口内往下滴 n 行值。第一个参数为列名,第二个参数为往下滴 n 行(默认为 1 ),第三个参数为默认值(当往下第n行为NULL时候,取默认值,如不指定,则为NULL)LAG (col原创 2020-09-20 21:10:18 · 1406 阅读 · 0 评论 -
Hive实战 | 谷粒影音案例
上一篇博客介绍了Hive的蚂蚁森林实战案例,本篇博客是关于谷粒影音案例的实战。数据结构我们先看一下拿到的表以及字段。有两张表,第一张是视频表gulivideo_orc,第二张是用户表gulivideo_user_orc。具体数据结构如下表所示:字段汇总如下:Table: gulivideo_orc字段:videoid, uploader, age, category, length, views, rate, ratings, comments, relatedIdTable: guli原创 2020-06-17 20:26:02 · 656 阅读 · 2 评论 -
Hive实战 | 蚂蚁森林案例
前两天学习了 Hive,本篇博客将以案例的形式对之前学过的知识进行应用。场景描述本案例的场景是关于蚂蚁森林,没错,就是支付宝里的蚂蚁森林。首先这里有两张表。一张记录了用户每天的蚂蚁森林低碳生活领取的记录流水。table_name: user_low_carbon字段如下:user_id data_dt low_carbon用户 日期 减少碳排放(g)u_002 2017/1/2 150u_002 2017/1/2原创 2020-06-17 16:53:59 · 2029 阅读 · 4 评论
分享