
hql
文章平均质量分 93
主要介绍Hive中hql的相关操作
慢点走
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
hive中,cluster by为什么会出现?有什么意义?有什么用处?有什么应用场景?
前段时间,因为项目原因,了解了cluster by,顺路写了一篇博客:HIVE中,cluster by有什么意义。然后底下有人回复:假如100个专业分了10个区,那么每一个区里都应该会有不同的专业。但反过来说,真正的mr 并没有完全按专业分区,如果完全的话那应该是100个区。问题是结果只有10个区,这么做意义的结果总结一下应该是:cluster by 的字段只是参原创 2021-05-20 23:00:47 · 7300 阅读 · 11 评论 -
hive中,如何格式化timestamp?如何将timestamp类型的字段转化为指定格式的字符串?
hive中的时间类型有两种:date 和 timestamp。date只存储日期,timestamp则存储纳秒级别的时间戳。当需要存储小时及更精细的时间的时候,就只能使用timestamp了。 然而在实践中,发现一个问题,存好存,但是取不好取。原创 2020-12-17 22:33:57 · 13442 阅读 · 0 评论 -
sql - 分段统计前N高的问题
文章目录一、 前1高第一种解决办法第二种解决办法 - over()案例二、 前N高第一种解决办法第二种解决办法 - over()案例 最近做了一些sql的题,想着总结一下吧,所以就有了下面这篇博文。 sql中经常会遇到一类需求:需要分段统计前N高。例如:每...原创 2020-04-10 17:53:57 · 514 阅读 · 0 评论 -
用join实现交集,并集,差集,补集的效果
sql集合运算的关键字 sql中,对于集合的计算有:并集、差集、交集。 并集:union,union all 差集:EXISTS,not in,except &...原创 2020-04-09 17:48:16 · 8689 阅读 · 2 评论 -
HIVE中,cluster by有什么意义
文章目录1. cluster by 是什么?2. cluster by有什么意义?1. cluster by 是什么? 如果想彻底了解:HIVE中,order by、sort by、 distribute by和 cluster by的区别,请查看HIVE中,order by、sort by、 distribute by和 ...原创 2020-03-18 21:32:40 · 16120 阅读 · 5 评论 -
HIVE中,order by、sort by、 distribute by和 cluster by区别,以及cluster by有什么意义
文章目录1. oreder by2. sort by3. distribute by4. cluster by5. cluster by有什么意义?1. oreder by 主要是做全局排序。 只要hive的sql中指定了order by,那么所有的数据...原创 2020-03-18 21:22:44 · 5905 阅读 · 8 评论 -
Hive中,同时存在map、array、struct,建表语句应该怎么指定分隔符?
文章目录 Hive中存在map、array、和struct格式,那如果同时存在这三种格式时,建表语句的分隔符应该怎么指定呢? 一、 先说答案 先说答案:create table t...原创 2020-03-17 13:04:42 · 1817 阅读 · 1 评论