目录
3.1.2 将数据load加载到t_usa_covid19表
4.1.1 使用union查询student_local和student_hdfs
4.1.3 union之前的的表需要排序或者限制表的查询数量
一、前言
由于Hive是基于Hadoop的数据仓库,是面向分析支持分析工具。将已有的结构化数据文件映射成为表,然后提供SQL分析数据的能力。因此在Hive中常见的操作就是分析查询select操作。
Hive早期是不支持update和delete语法的,因为Hive所处理的数据都是已经存在的的数据、历史数据。后续Hive支持了相关的update和delete操作,不过有很多约束。详见Hive事务的支持。
二、Hive select 完整语法树
看hive的select语法树,对于熟悉mysql的同学是不是觉得里面有些关键词比较熟悉,在hive的select 语法中,尤其值得注意的就是from后面的内容,表示从哪里获取数据,可以是普通物理表、视图、join结果或子查询结果;
[WITH CommonTableExpression (, CommonTableExpression)*]
SELECT [ALL | DISTINCT] select_expr, select_expr, ...
FROM table_reference
[WHERE where_condition]
[GROUP BY col_list]
[ORDER

本文详细介绍了Hive的SELECT语法,包括数据准备、常用语法、DISTINCT关键字、分区查询、GROUP BY、HAVING、LIMIT、UNION、子查询以及CTE等内容。通过实际操作演示,讲解了如何进行数据查询、分组聚合、去重、联接查询等,适合Hive初学者和开发者参考。
订阅专栏 解锁全文
8563

被折叠的 条评论
为什么被折叠?



