Hive数据仓库——DDL、DQL概述
Hive–HQL语法–DDL
- 创建数据库 create database XXXXX;
- 查看数据库 show databases;
- 删除数据库 drop database tmp;
- 强制删除数据库:drop database tmp cascade;
- 查看表:SHOW TABLES;
- 查看表的元信息:
- desc test_table;
- describe extended test_table;
- describe formatted test_table;
- 查看建表语句:show create table table_XXX;
- 重命名表:alter table test_table rename to new_table;
- 修改列数据类型:alter table lv_test change column colxx string;
- 增加、删除分区:
- alter table test_table add partition (pt=xxxx);
- alter table test_table drop if exists partition(…);
Hive–HQL语法–DML
- where用于过滤,分区裁剪,指定条件
- join用于两表关联,left out join,left join,right join,join,mapjoin(1.2版本后默认开启)
- group by用于分组聚合
- order by用于全局排序,要尽量避免排序,是针对全局排序的,即对所有的reduce输出是有序的
- sort by sortby:当有多个reduce时,只能保证单个reduce输出有序,不能保证全局有序
cluster by = distribute by + sort by - distinct 去重
Hive HQL图解
靓仔不久会详细介绍Hive的初级函数以及高级函数,快来关注一下吧!

本文详细介绍了Hive数据仓库中的DDL(数据定义语言)和DML(数据操纵语言)操作。包括创建、查看和删除数据库,显示和修改表结构,以及处理分区。同时,还讲解了HQL中的过滤、关联、分组、排序等DML操作。对于Hive初学者,本文提供了丰富的实例和图解,帮助理解Hive的基本语法和函数使用。后续将深入探讨Hive的更多高级功能。

被折叠的 条评论
为什么被折叠?



