
HiveSQL
华夏_数据分析
一些有关数据分析的想法与感悟
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
HiveSQL基础之窗口函数
1. 累计窗口函数sum(…) over(…)2018年每月支付总额和当年累积支付总额SELECT a.month, a.pay_amount, sum(a.pay_amount) over(order by a.month)FROM (SELECT month(dt) as month, sum(pay_amount) as pay_amount FRO...原创 2019-08-18 23:48:35 · 798 阅读 · 0 评论 -
HiveSQL常用技巧
1. 去重技巧—用group by替换distinct取出user_trade中的全部支付用户## 原有写法SELECT distinct user_nameFROM user_tradeWHERE dt>'0';## 优化写法SELECT user_nameFROM user_tradeWHERE dt>'0'GROUP BY user_name;在2...原创 2019-08-19 22:14:43 · 717 阅读 · 0 评论 -
HiveSQL基础之常用函数
1. 如何把时间戳转换成日期语法from_unixtime(bigint unixtime, string format)format1. yyyy-MM-dd hh:mm:ss2. yyyy-MM-dd hh3. yyyy-MM-dd hh:mm4. yyyyMMdd举例SELECT from_unixtime(paytime,'yyyy-MM-dd h...原创 2019-08-16 22:23:23 · 750 阅读 · 0 评论 -
HiveSQL基础之表连接
1. inner join内连接,返回两个表的交集既在user_list_1又在user_list_2的用户SELECT * FROM user_list_1 as aJOIN user_list_2 as bON a.user_id=b.user_id;表连接时,必须进行重命名on后面使用的连接条件必须起到唯一键值的作用inner可以省略不写,效果一样一定要先去重,再...原创 2019-08-17 17:51:32 · 1820 阅读 · 0 评论