hive外部表使用分区partition

本文介绍了如何在Hive中创建外部表并使用分区,强调了分区名称不能与字段名称重复,同时展示了查看外部表目录变化的步骤。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

      1)创建外部表

create external table test(username String,work string) PARTITIONED BY(year String, month String, day String) ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' LOCATION '/tmp/test/';
      2)修改表创建分区

alter table test add partition (year='2010', month='04', day='18') location '2010/04/18';

     ps:分区的名称不能和字段的名称重复

      3)查看外部表目录变化

[hadoop@hadoopmaster hadoop-1.0.3]$ bin/hadoop fs -mkdir /tmp/test/
[hadoop@hadoopmaster hadoop-1.0.3]$ bin/hadoop fs -ls /tmp/test/
Found 1 items
drwxr-xr-x   - hadoop supergroup          0 2012-07-03 19:17 /tmp/test/2010
[hadoop@hadoopmaster hadoop-1.0.3]$ bin/hadoop fs -ls /tmp/test/2010
Found 1 items
drwxr-xr-x   - hadoop supergroup          0 2012-07-03 19:17 /tmp/test/2010/04
[hadoop@hadoopmaster hadoop-1.0.3]$ bin/hadoop fs -ls /tmp/test/2010/04
Found 1 items
drwxr-xr-x   - hadoop supergroup          0 2012-07-03 19:17 /tmp/test/2010/04/18
    4)给外部表加载数据

bin/hadoop fs -put /tmp/test.txt /tmp/test/2010/04/18/
    5)执行测试查询

hive> select * from test limit 10;
OK
zzz     it      2010    04      18
xxx     edu     2010    04      18
Time taken: 0.42 seconds
hive> select * from test where year='2010' and month='04' and day='18' limit 10;
OK
zzz     it      2010    04      18
xxx     edu     2010    04      18
Time taken: 0.287 seconds
hive> select * from test where year='2010' and month='04' and day='19' limit 10;
OK
Time taken: 0.113 seconds
hive> 





评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值