1、数据库相关
Hive配置单元包含一个名为 default 默认的数据库.
- —创建数据库
create database [if not exists] ;
- –显示所有数据库
show databases;
- –删除数据库
drop database if exists [restrict|cascade];
默认情况下,hive不允许删除含有表的数据库,要先将数据库中的表清空才能drop,否则会报错
–加入cascade关键字,可以强制删除一个数据库
hive> drop database if exists users cascade;
- –切换数据库
use ;
2、内部表外部表
建内部表
create table
student(Sno int,Sname string,Sex string,Sage int,Sdept string)
row format delimited fields terminated by ',';
建外部表
create external table
student_ext(Sno int,Sname string,Sex string,Sage int,Sdept string)
row format delimited fields terminated by ',' location '/stu';
linux本地或者hdfs上加载
load data local inpath '/root/hivedata/students.txt' overwrite into table student;
load data inpath '/stu' into table student_ext;
3、创建分区表
- 分区建表分为2种,一种是单分区,也就是说在表文件夹目录下只有一级文件夹目录。另外一种是多分区,表文件夹下出现多文件夹嵌套模式。
- 单分区建表语句
create table day_table (id int, content string) partitioned by (dt string);
单分区表,按天分区,在表结构中存在id,content,dt三列。
- 双分区建表语句
create table day_hour_table (id int, content string) partitioned by (dt string, hour string);
双分区表,按天和小时分区,在表结构中新增加了dt和hour两列。
- 创建orc,snappy格式的表
CREATE EXTERNAL TABLE `st_center.st_center_group_acc_charge_data`(
`logdt` string,
`apptypeid` string,
`qid` string,
`os` string,
`ver` string,
`channel_na

本文详细介绍了Hive的各种操作,包括创建和删除数据库、内部表与外部表的区别、分区表的创建和管理,以及JSON数据的解析。还讲解了如何保存Hive查询结果到本地和HDFS,并涉及外部表的删除与重建、增加列以及修改表的文件路径等进阶操作。
最低0.47元/天 解锁文章
4567

被折叠的 条评论
为什么被折叠?



