hive内部表外部表的创建及load数据

内部表

创建hive内部表
create table test_01(id bigint, name string ) row format delimited fields terminated by ',';
默认记录和字段分隔符:
 
\n   每行一条记录
 
^A    分隔列(八进制 \001)
 
^B    分隔ARRAY或者STRUCT中的元素,或者MAP中多个键值对之间分隔(八进制 \002)
 
^C    分隔MAP中键值对的“键”和“值”(八进制 \003)
 
 
 
自定义分隔符:
 
CREATE TABLE test(
 
    ……
 
)
 
ROW FORMAT DELIMITED
 
FIELDS TERMINATED BY '\001'
 
COLLECTION ITEMS TERMINATED BY '\002'
 
MAP KEYS TERMINATED BY '\003'
 
LINES TERMINATED BY '\n'
创建测试数据文件
vi test_01;
 
1,test1
2,test2
3,test3
4,test4
5,test5
6,test6
7,test7
将数据文件上传到hdfs并加载到hive,发现hdfs中的文件会被移动到hive表目录,而不是拷贝
hdfs dfs -put test_01 /test
load data inpath '/test/test_01' into table test_01;
再次上传并加载,会追加数据到hive表中,并且hive目录存在test_01和test_01_copy_1两个文件
hdfs dfs -put test_01 /test
load data inpath '/test/test_01' into table test_01;
再次上传并使用overwrite加载,原先的test_01/test_01_copy_1两个文件会先被删除,新文件test_02被移动到hive表目录中
hdfs dfs -put test_01 /test/test_02
load data inpath '/test/test_02' overwrite into table test_01;
删除表后目录文件及meta数据都会被删除
drop table test_01;
外部表

创建hive外部表,如果指定location 'xxx'会在hdfs中创建对应目录并将load的文件移动至该目录下,否则会在hive表下创建test_02目录并装载文件
create EXTERNAL table test_02(id bigint, name string) row format delimited fields terminated by ',';
将数据文件上传到hdfs并加载到hive
hdfs dfs -put test_01 /test
load data inpath '/test/test_01' into table test_02;
删除表后目录及文件依然存在,只会删除test_02的meta数据,再次创建表即可查询历史数据
drop table test_02;
--------------------- 
作者:白开水v5 
来源:优快云 
原文:https://blog.youkuaiyun.com/xiongbingcool/article/details/82982099 
版权声明:本文为博主原创文章,转载请附上博文链接!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值