目录
一、前言
使用hive对数据表加载数据时方式有很多,比如直接通过insert into插入数据,或者先创建表,然后在hdfs上面上传数据文件进行数据加载的方式等等,本篇将重点介绍如何对hive的table进行数据的导入导出。
二、load 命令使用
在正式开始之前,先来回顾下之前的文章中讲到的一种常用的数据加载方式,即使用load的方式进行数据映射;
总结来说,包括如下几点:
- 在Hive中建表成功之后,就会在HDFS上创建一个与之对应的文件夹,且文件夹名字就是表名;
- 文件夹父路径是由参数hive.metastore.warehouse.dir控制,默认值是/user/hive/warehouse;
- 也可以在建表的时候使用location语句指定任意路径;

默认情况下,当我们创建完成一个table之后,不管路径在哪里,只有把数据文件移动到对应的表文件夹下面

本文详细介绍了Hive中的load命令和insert命令的使用,包括load的基本概念、语法规则、数据加载操作及新特性,以及insert命令的语法、insert+select操作演示、多重插入和动态分区插入的使用。通过实例展示了如何高效地加载和导入Hive数据。
订阅专栏 解锁全文
7430

被折叠的 条评论
为什么被折叠?



