Hive import/export使用总结

最新推荐文章于 2023-05-23 09:46:41 发布

原创

最新推荐文章于 2023-05-23 09:46:41 发布 · 1.3k 阅读

3 ·

CC 4.0 BY-SA版权

本文总结了Hive数据迁移的应用场景和操作方法，包括简单表及分区表的导出、导入，以及内部表到外部表的转换。适用于在不同集群间进行数据迁移的需求。

应用场景：

数据迁移：Hive中的数据表要迁移到另一套集群上，使用导入导出命令操作

官网语法：

EXPORT TABLE tablename [PARTITION (part_column="value"[, ...])]
  TO 'export_target_path' [ FOR replication('eventid') ]

IMPORT [[EXTERNAL] TABLE new_or_original_tablename [PARTITION (part_column="value"[, ...])]]
  FROM 'source_path'
  [LOCATION 'import_target_path']

简单表的导入导出：

export table emp to '/user/hive/warehouse/exp_emp';
#导出的数据包括"_metadata"和"data"两个目录

import from '/user/hive/warehouse/exp_emp';

简单表的导出、改名导入：

export table emp to '/user/hive/warehouse/exp_emp';

import table rename_emp from '/user/hive/warehouse/exp_emp';

分区表的导入导出：

export table emp_partition 
 partition (deptno="10") 
 to '/user/hive/warehouse/exp_emp_part';

import fr

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

浅汐王

关注关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

【Hive】Hive之import和export使用详解

m0_54252387的博客

06-29

1630

在hive-0.8.0后引入了import/export命令。Export命令可以导出一张表或分区的数据和元数据信息到一个输出位置，并且导出数据可以被移动到另一个hadoop集群或hive实例，并且可以通过import命令导入数据。当导出一个分区表，原始数据可能在hdfs的不同位置，export/import命令也支持导出分区表的不同子分区。导出的元数据存储在目标目录，并且数据文件是存储在不同的子目录下。Export/import命令可以独立工作在使用存储元数据的rdbms中。一、语法Export语法：EX

hive导入导出（import/export)

Realoyou的博客

01-29

1730

1. 概括 Hive 0.8.0 之后引入了EXPORT and IMPORT 命令。 EXPORT命令将表或分区的数据连同元数据一起导出到指定的输出位置（HDFS上）。然后可以将此输出位置移至不同的Hadoop或Hive实例，并使用IMPORT命令进行导入操作。导出分区表时，原始数据可能位于不同的HDFS位置。还支持导出/导入分区子集的功能。导出的元数据存储在目标目录中，数据文件存储在...

参与评论您还未登录，请先登录后发表或查看评论

Hive EXPORT 與IMPORT命令操作

qq_39841823的博客

01-18

1121

文章目录前言一、EXPORT TABLE二、IMPORT TABLE问题：hdfs 上的csv汇入方法,目前不建议使用import table 前言如果需要匯出數據或匯入數據，我們可以透過Hive EXPORT 與IMPORT的命令將數據進行導出導入。 EXPORT TABLE tablename [PARTITION (part_column="value"[, ...])] TO 'export_target_path' IMPORT [[EXTERNAL] TABLE new_or_or

Hive之import和export使用详解

weixin_33877092的博客

05-12

461

在hive-0.8.0后引入了import/export命令。 Export命令可以导出一张表或分区的数据和元数据信息到一个输出位置，并且导出数据可以被移动到另一个hadoop集群或hive实例，并且可以通过import命令导入数据。当导出一个分区表，原始数据可能在hdfs的不同位置，export/import命令也支持导出分区表的不同子分区。导出的元数据存储在目标目录，并且数据文件是存...

HIVE export import

lm709409753的专栏

01-19

1367

export 格式：export table to ‘hdfs_path’ hive (default)> export table liangman21 to '/user/liangman/input' > ; FAILED: SemanticException Line 1:13 Invalid path ''/user/liangman/input'': Tar

Hive数据导入

chongfa2008的博客

08-02

263

Hive-Import/Export（导入导出）

01-11

5521

1 官方地址 Hive 0.8.0 之后引入了EXPORT and IMPORT 命令。 EXPORT命令将表或分区的数据连同元数据一起导出到指定的输出位置（HDFS上）。然后可以将此输出位置移至不同的Hadoop或Hive实例，并使用IMPORT命令进行导入操作。导出分区表时，原始数据可能位于不同的HDFS位置。还支持导出/导入分区子集的功能。导出的元数据存储在目标目录中，数据文件存储...

Hive ImportExport 使用指南

hanli2020的博客

01-13

705

ImportExport 使用指南官方文档地址导入/导出概述导出语法复制使用例子 1.概述 EXPORT命令将表或分区的数据以及元数据导出到指定的输出位置。然后可以将这个输出位置移动到另一个Hadoop或Hive实例，并使用IMPORT命令从那里导入。导出分区表时，原始数据可能位于不同的HDFS位置。还支持导出/导入分区子集的功能。导出的元数据存储在目标目录中，数据文件存...

hive export/import逻辑迁移命令简单梳理

VincentQB的博客

01-10

884

hive export/import逻辑迁移命令简单梳理

sqoop1: import to hive partitioned table

08-05

NULL 博文链接：https://ylzhj02.iteye.com/blog/2051729

hive笔记-export/import

然然然星人的博客

01-08

1363

该EXPORT命令将表或分区的数据连同元数据一起导出到指定的输出位置。然后可以将此输出位置移至不同的Hadoop或Hive实例，并使用该IMPORT命令从那里导入。导出分区表时，原始数据可能位于不同的HDFS位置。还支持导出/导入分区子集的功能。导出的元数据存储在目标目录中，数据文件存储在子目录中。EXPORT和IMPORT命令中使用的源和目标metastore DBMS的独立工作; 例如，它们可...

HIVE学习笔记----数据导入

weixin_39855111的博客

07-25

363

使用load语句 load data [local] inpath 'filepath' [overwrite] ------(写local是为了表示从操作系统导入，不写则表示从HDFS导入) -----（写over...

Hive Export和Import介绍及操作示例

weixin_33816611的博客

10-12

2859

2019独角兽企业重金招聘Python工程师标准>>> ...

Hive中数据导入导出（Import和Export）

大数据学习成长之路

03-08

7481

官方文档地址：https://cwiki.apache.org/confluence/display/Hive/Home导出EXPORT将hive表中的数据导出到外部。语法：EXPORT TABLE tablename [PARTITION (part_column="value"[, ...])] TO 'export_target_path' [ FOR replication('even...

hive-数据导入导出(超级详细)

互联网知识分享

05-23

2001

而hdfs中create的表名在hdfs是看不到的，只有 location 的表名可以看到，虽然上下的两个表名可以不一致，但是一般使用一样容易区分,注释:从表3查询出来的结果给表1和表2做为数据插入，其中表1和表2可以是临时要创建的新字段，也可以是旧字段，当然3个表也可以是相同。）注释: 表名1的数据要导入给表名2 ，表的结构是要相同的，内部表对内部表，外部表对外部表，且字段结构个数都要相同。partition(1级分区字段=值[,2级分区字段=值]) values(a,b,...)

【hive】INFO hive.HiveImport: FAILED: Execution Error, return code 1 from org.apache

依旧的博客

09-24

5665

20/09/24 14:38:37 INFO hive.HiveImport: FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask. MetaException(message:An exception was thrown while adding/validating class(es) : Column length too big for column 'PARAM_VALUE' (ma

hive导入/导出表数据

qq_28603127的博客

06-14

474

导入准备数据创建表 create table hive_test(id int,name string) row format delimited fields terminated by ','; 1 直接导入本地文件 load data local inpath '/export/data/hive_input/hive_test.txt' into table hive_test; 如果是hdfs文件去除local 2 put文件到hive对应的hdfs文件先创建表,然后通过将文件上传到h

HIVE数据的导入与导出详解

qq_33361080的博客

09-13

465

1.导入 load data [local] inpath '' [overwrite] into database.table [partition(partcol=val)] 原始文件在linux本地加上local 如果原始数据文件在hdfs 不用local 如果是覆盖数据加上overwrite 如果是追加不要overwrite 如果是分区表加上partition，不是就不用...

hive中load insert export import的作用与区别

最新发布

11-26

### 作用 - **Load**：用于将数据加载到 Hive 表中。可以从本地文件系统或 HDFS 加载数据到 Hive 的管理表或外部表。例如，将本地文件 `data.txt` 加载到 Hive 表 `my_table` 中： ```sql LOAD DATA LOCAL INPATH 'data.txt' INTO TABLE my_table; ``` - **Insert**：主要用于向 Hive 表中插入数据。可以通过查询语句将查询结果插入到目标表，也可将数据插入到文件系统的指定目录。例如，将 `table1` 的查询结果插入到 `table2`： ```sql INSERT INTO TABLE table2 SELECT * FROM table1; ``` 还可以使用 `INSERT OVERWRITE DIRECTORY` 将查询结果导出到指定目录： ```sql insert overwrite local directory '/tmp/out1' select * from table1; ``` - **Export**：用于将 Hive 表的数据和元数据导出到指定的 HDFS 路径。导出后的数据可以在其他 Hive 环境中使用 `IMPORT` 导入。示例： ```sql EXPORT TABLE student TO '/user/hive/warehouse/export/student'; ``` - **Import**：用于将之前使用 `EXPORT` 导出的数据和元数据导入到指定的 Hive 表中。示例： ```sql IMPORT TABLE student FROM '/user/hive/warehouse/export/student'; ``` ### 区别 - **操作对象**： - `Load` 和 `Insert` 主要操作的是 Hive 表，向表中添加数据。 - `Export` 和 `Import` 操作的是数据和元数据，用于在不同 Hive 环境间迁移表。 - **数据来源与去向**： - `Load` 是从文件系统（本地或 HDFS）将数据加载到 Hive 表。 - `Insert` 可以从查询结果插入到表，也可将查询结果导出到文件系统目录。 - `Export` 是将 Hive 表的数据和元数据导出到 HDFS 路径。 - `Import` 是将 HDFS 路径下导出的数据和元数据导入到 Hive 表。 - **数据处理方式**： - `Load` 只是简单地将数据文件移动或复制到表的数据存储位置。 - `Insert` 会执行查询语句，并将查询结果插入到目标表或导出到目录。 - `Export` 会将表的元数据和数据打包存储到指定路径。 - `Import` 则是将打包的数据和元数据恢复到 Hive 表。 - **对元数据的处理**： - `Load` 和 `Insert` 主要关注数据本身，对元数据的影响较小。 - `Export` 会导出表的元数据和数据。 - `Import` 会根据导出的元数据和数据恢复表。