Linux--shell编程中分区表常用操作 全面且详细

本文详细介绍了Hive中的分区表概念,包括创建分区表的语法、创建多分区表、加载数据到分区、查看和管理分区(如添加、删除)的方法。这些操作有助于优化大数据处理和存储管理。

文章中关于分区表常用操作目录:

一、概念

二、​​​​​​​创建分区表语法

​​​​​​​三、创建一个表带多个分区

四、​​​​​​​加载数据到分区表中

五、加载数据到一个多分区的表中去

​​​​​​​六、查看分区

七、​​​​​​​添加一个分区

八、​​​​​​​同时添加多个分区

九、​​​​​​​删除分区


​​​​​​​分区表:

​​​​​​​一、概念

在大数据中,最常用的一种思想就是分治,我们可以把大的文件切割划分成一个个的小的文件,这样每次操作一个小的文件就会很容易了,同样的道理,在hive当中也是支持这种思想的,就是我们可以把大的数据,按照每天,或者每小时进行切分成一个个的小的文件,这样去操作小的文件就会容易得多了。

二、​​​​​​​创建分区表语法

create table score(s_id string,c_id string, s_score int)  

partitioned by (month string) 

row format delimited

fields terminated by '\t';

​​​​​​​三、创建一个表带多个分区

create table score2 (s_id string,c_id string, s_score int) 

partitioned by (year string,month string,day string) 

row format delimited

fields terminated by '\t';

四、​​​​​​​加载数据到分区表中

load data local inpath '/export/data/hive_data/score.txt' into table score

partition (month='202006');

五、加载数据到一个多分区的表中去

load data local inpath '/export/data/hive_data/score.txt' into table score2

partition(year='2020',month='06',day='01');

​​​​​​​六、查看分区

show  partitions  score;

七、​​​​​​​添加一个分区

alter table score add partition(month='202005');

八、​​​​​​​同时添加多个分区

alter table score add partition(month='202004') partition(month = '202003');

注意:添加分区之后就可以在hdfs文件系统当中看到表下面多了一个文件夹

九、​​​​​​​删除分区

alter table score drop partition(month = '202006');

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

nuhao_

谢谢你打赏

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值