【Hadoop/Hive/mapreduce】系列之如何删除HIVE 表格的分区

本文介绍了一种使用Hive进行大规模数据处理的方法,通过每日融合数据并创建新的分区,同时为节省空间,实施了删除三天前旧分区的策略。此过程涉及核心Hive SQL代码,展示了如何在数据量巨大时进行高效的数据管理和维护。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

今天的一个业务场景就是要把三年的数据从第一天不停的融合起来,每一天作为表格一个新的分区。由于空间有限,数据量很大,可能每天数据都是几十个G的大小。所以我需要做的一点就是在融合这一天之后,删除一天的分区数据,为了保险起见,我删除这一天的前三天的数据。

大致代码是这样的

function shan(){
cat <<EOF
ALTER TABLE table_name DROP PARTITION (dt='$san');
EOF
}

first=20160706
second=20190310

while [ "$first" -le "$second" ]
do
    zhong=`date -d "1 days ago ${first}" +%Y%m%d`
    hive -e "`merge`" #这行代码就是在生成当天的数据融合
    san=`date -d "3 days ago ${first}" +%Y%m%d`
    hive -e "`shan`" #删除三天前的数据
    let first=`date -d "-1 days ago ${first}" +%Y%m%d`
done

当然核心代码就是删除分区的那个代码

ALTER TABLE table_name DROP PARTITION (dt='$san');

转载于:https://www.cnblogs.com/lzida9223/p/10511466.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值