Hive数据导入的类型

本文介绍了Hive数据导入的六种类型,包括从本地文件系统和HDFS导入,覆盖已有数据,通过CREATE TABLE AS SELECT及INSERT语句加载,以及使用LOCATION指定数据位置。详细解释了每种方式的特点和操作示例。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1.Hive数据导入的六种类型:

以下面两个表来实验:


1.从本地文件系统导入到hive表中:

使用load data语句可以直接导入本地文件到hive表中,加关键字local表示从本地系统上传文件到hive表:


2.从HDFS导入文件到hive表中:

如果不加关键字local表示从hdfs加载文件到hive表。下面先上传本地文件到hdfs,再加载到hive表:


load语句实际上是 移动文件

3.加载数据覆盖表中已有的数据:

上边2个语句中,load data语句,OVERWRITE参数决定加载文件时是否覆盖。

4.创建表时通过select语句加载:

create table ... as 语句会走mapreduce。

5.创建表,通过insert语句加载:

可以增加overwrite选项,来选择insert时,是否覆盖原表的数据。如果不加overwrite参数再执行一次该语句,那么emp3表的数据将会翻倍,查看该表hdfs的目录,会发现有2个文件(而不是一个文件):


6.创建表的时候通过Location指定:

先创建一张表,并指定该表的LOCATION,之后往LOCATON目录(HDFS上的路径)上传数据文件,再查询表时,就可以看到数据了。


如果先上传文件,再创建一个表,LOCATION目录是上传的HDFS目录的话,上传的目录会被覆盖清空。


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值