hive基础:建表+导入数据+导出大文件

本文介绍了Hive的基础操作,包括如何建表,如指定数据列分隔符和行分隔符,以及是否分区。接着详细讲解了导入外部数据、从其他表导入数据和重写表数据的方法。此外,还讨论了导出大文件的策略,如使用INSERT OVERWRITE DIRECTORY语句。最后,提到了删除Hive分区数据的两种方式:TRUNCATE和DROP,以及它们的区别。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

hive基础*:建表+导入数据+导出大文件

1.建表

fields terminated by 数据列分隔符,根据实际情况定

lines terminated by 数据行分隔符,根据实际情况定

partitioned表示分区,数据量不大、无区域数据调整的情况下,一般不用分区。不用时,直接将 PARTITIONED BY(**) 删除即可

stored as 文件格式,见《Hive文件格式(表STORE AS 的四种类型)》

location 对应一个目录

建表语句如下:

drop table if exists test_1;
create external table test_1(
 activity_id string comment '活动id'
,tocc_name   string comment '活动名称'
,app_key     string
,page   string
,visit_type   string comment '访问类型'
)
PARTITIONED BY (
day string	comment '天分区'
)
row format delimited fields terminated by '\t'
lines terminated by '\n'
stored as textfile
location '/user/test/acticity';
2.1导入外部数据

需要先将表文件处理好,(1)注意数据的格式,最常见的为将含中文的文件保存为utf-8格式&#

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值