-
概述
本文介绍了在同一hive表中对不同的分区采用不同的存储格式来存储数据的操作步骤。
-
具体操作
-
数据准备
这里以如下几条数据作为例子
-
创建hive表
create table day_table (id int, content string) partitioned by (dt string) row format delimited fields terminated by '|'
-
创建两个不同格式的分区
这里创建两个不同格式的分区:20140804(textfile)和20140805(RCFile)
创建分区:
|
设置分区格式:
|
查看是否分区格式是否成功:
|
|
-
导入数据
为不同的分区导入不同格式的数据(这里不能用hive的load方式导入数据,因为load会检查导入数据hive表格式是否匹配,因此采用直接将数据放入到该分区对应的HDFS上面)。据分析应该讲textfile的文件放入到/user/hive/warehouse/day_table/dt=20140804,将RCFile的文件放入到/user/hive/warehouse/day_table/dt=20140805中.
-
结果查询
|
可以得出hive可以支持不同分区采用不同存储格式的方式来存储数据。