Sqoop导入导出数据

最新推荐文章于 2025-06-07 19:07:16 发布

BigData_Hadoop

最新推荐文章于 2025-06-07 19:07:16 发布

阅读量890

点赞数

CC 4.0 BY-SA版权

分类专栏： Sqoop学习文章标签： Sqoop SQL Hive HDFS HBase

本文链接：https://blog.youkuaiyun.com/Li_and_Li/article/details/80860177

Sqoop学习专栏收录该内容

1 篇文章

订阅专栏

Sqoop
- 安装部署
  - sqoop相关配置
- 测试Sqoop

Sqoop

安装部署

sqoop –> 1.4.7 点击下载

hadoop –>2.7.5

默认系统已经安装了mysql或者mariadb

将下载好的sqoop的二进制包解压到/usr/local下然后进行配置

sqoop相关配置

配置环境变量

# vim /etc/profile
export SQOOP_HOME=/usr/local
export PATH=$SQOOP_HOME/bin:$PATH
:wq
# source /etc/profile

配置sqoop相关参数

# cp conf/sqoop-env-template.sh conf/sqoop-env.sh
# vim conf/sqoop-env.sh
# Hadoop  
export HADOOP_PREFIX=/usr/local/hadoop
export HADOOP_HOME=${HADOOP_PREFIX}  
export PATH=$PATH:$HADOOP_PREFIX/bin:$HADOOP_PREFIX/sbin
export HADOOP_COMMON_HOME=${HADOOP_PREFIX}  
export HADOOP_HDFS_HOME=${HADOOP_PREFIX}  
export HADOOP_MAPRED_HOME=${HADOOP_PREFIX}
export HADOOP_YARN_HOME=${HADOOP_PREFIX}  
# Native Path  
export HADOOP_COMMON_LIB_NATIVE_DIR=${HADOOP_PREFIX}/lib/native  
export HADOOP_OPTS="-Djava.library.path=$HADOOP_PREFIX/lib/native" 
# Hadoop end

#Hive
export HIVE_HOME=/usr/local/hive
export PATH=$HIVE_HOME/bin:$PATH

#HBase
export HBASE_HOME=/usr/local/hbase
export PATH=$HBASE/bin:$PATH

下载mysql驱动

在conf/lib目录下

# wget http://central.maven.org/maven2/mysql/mysql-connector-java/5.1.38/mysql-connector-java-5.1.38.jar

测试Sqoop

从mariadb导入到HDFS

# sqoop import \
--connect jdbc:mysql://localhost/test \
--username root \
--password 111111  \
--table table1 \
-m 1 \
--target-dir /test
# hadoop fs -ls /test
# hadoop fs -cat /test/part*

命令解析：

sqoop # sqoop命令
import # 表示导入
–connect jdbc:mysql://ip:port/test # 告诉jdbc,连接mysql的url
–username root # 连接mysql/mariadb的用户名
–password 111111 # 连接mysql/mariadb的密码
–table table1 # 从数据库中导出的表的名字
–query # 查询语句
–columns # 指定列
–where # 条件
–hive-import # 指定为hive导入
–hive-table # 指定hive表，可以使用–target-dir /test替换
–fields-terminated-by ‘\t’ # 指定输出文件中的行的字段分隔符
-m 1 # 复制整个过程使用一个map作业

从HDFS导出到mariadb

# sqoop export \
--connect jdbc:mysql://localhost:3306/test \
--driver com.mysql.jdbc.Driver \
--username root \
--password 111111 \
--table table1 \
--export-dir /test

从mariadb导入HBase

# hbase shell
# create 'test', 'column'
# sqoop import \
--connect jdbc:mysql://localhost:3306/test \
--username root \
--password 111111 \
--table table1 \
--hbase-table test \
--hbase-row-key id \
--column-family data \
--hbase-create-table \
--m 1

其中–hbase-row-key 的id是RDBMS中的一个列，作为行键，RDBMS的表中有逐渐，那么主键就为HBase的行键。

从HBase导出到mariadb

从mariadb导入Hive

在从RDBMS导入HIVE中的时候，出现如下错误：

Sqoop导入Hive

只要sqoop找到hive-exec.jar即可，所以我们在配置了HIVE_CONF_DIR之后还要执行以下命令：

# ln -s $HIVE_HOME/lib/hive-exec.jar $SQOOP_HOME/lib/hive-exec.jar

以上在Hive的lib中如果jar包带有版本号，可根据情况进行链接创建。

# sqoop import --hive-import \
--connect jdbc:mysql://localhost/test 
--username root \
--password 111111 \
--table table1 \
--m 1 \
--delete-target-dir \
--verbose