hive外部分区表从创建到应用

该博客主要介绍Hive外部分区表的操作。首先设置表的数据存储目录,接着创建外部表和分区表,随后进行数据加载,包括创建目录和上传数据,之后修复分区,最后通过SQL语句进行测试,统计特定分区的数据数量。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

第一部分: 设置表的数据存储目录

bin/hdfs dfs -mkdir -p /user/yhq/lianjia_2nd_house;

第二部分:创建外部表,分区表

create EXTERNAL table db_lianjia.lianjia_2nd_house(
name STRING,
house_type STRING,
house_area STRING,
region STRING,
floor_str STRING,
direction STRING,
total_price STRING,
square_price STRING,
build_date STRING
)
PARTITIONED BY (month_str STRING COMMENT ‘first partition Month’,city_str STRING COMMENT ‘first partition City’)
ROW FORMAT DELIMITED FIELDS TERMINATED BY ‘,’
LINES TERMINATED BY ‘\n’
STORED AS TEXTFILE
LOCATION ‘/user/huadian/lianjia_2nd_house’;

第三部分:加载数据

1、 创建目录
bin/hdfs dfs -mkdir -p /user/yhq/lianjia_2nd_house/month_str=06/city_str=XA
2、 上传数据
bin/hdfs dfs -put /opt/datas/2nd_xa_06_price.csv /user/yhq/lianjia_2nd_house/month_str=06/city_str=XA

第四部分: 修复分区

ALTER TABLE db_lianjia.lianjia_2nd_house ADD IF NOT EXISTS PARTITION (month_str=“06”,city_str=“XA”)

第五部分:测试

select
count(1)
from
db_lianjia.lianjia_2nd_house
where
month_str=“06”

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值