[Hive]Hive多分区操作

本文介绍了在业务背景下如何创建和使用Hive的多分区表。内容包括业务需求、多分区表的概念、Hive分区表的建立以及数据导入的方法,并展示了实验结果和表结构。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

业务背景

mobile_log记录移动日志,现在需要将其保存到hive表中,将来可以按日期,小时进行统计,为此,需要建立一张具有日期、小时的hive分区表。

业务实现

hive分区表分为单分区表和多分区表,一个表可以拥有多个分区,每个分区都以文件夹的形式单独存放在表的文件目录下,详细可以参见Hive LanguageManual DDL

建立多分区表代码

drop table if exists pms.test_mobile_log;
create table pms.test_mobile_log 
(
    id          bigint,
    infomation  string
)
partitioned by (ds string, hour string)
row format delimited fields terminated by '\t'
lines terminated by '\n';

导入数据到多分区表中,实现方式有如下这些:

  • 建表的时候,就插入数据,参考:
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值