上一篇给大家介绍了 hive 的 DDL 数据定义语言,这篇来介绍一下 DML 数据操作语言。
没看过的可以点击跳转阅读:
hive从入门到放弃(一)——初识hive
hive从入门到放弃(二)——DDL数据定义
数据写入
数据导入部分默认数据文件格式为 textfile,每一列由‘,’进行分割,以换行分行。
insert
insert 表示向表中插入数据,可以直接插入值,也可以通过查询其他表获取数据插入。
INSERT INTO TABLE target_table VALUES (COL1.VALUE, COL2.VALUE, ...);
INSERT OVERWRITE TABLE target_table SELECT COL1, COL2, ... FROM source_table;
insert into 以追加数据的方式插入到表或分区,原有数据不会删除;
insert overwrite 则是覆盖原来的数据。
load
load data [local]① inpath② 'src_path' [overwrite] into table
target_table [partition (partcol1=val1,…)];
① local 加上此关键字则表示从本地加载数据,不加的话就