Sqoop的简介与安装

1,Sqoop概述

  • 1,概念
    Sqoop:SQL–to–Hadoop,本质还是一个命令行工具。
    Apache旗下一款“Hadoop 和关系数据库之间传送数据”的工具。
  • 2,功能
    在这里插入图片描述
    导入数据: 将关系型数据库(MySQL、Oracle 等)数据导入到 Hadoop 的 HDFS、Hive、HBase 等数据存储系统中;
    导出数据:从 Hadoop 的文件系统中导出数据到关系数据库(MySQL、Oracle等) 中。

Sqoop 工作机制

  • 将导入或导出命令翻译成 MapReduce 程序来实现
  • 对MapReduce 的Inputformat 和 Outputformat 进行定制

2,sqoop的安装

  • 1,前提准备

    安装好 JDK 和 Hadoop 集群

  • 2,下载安装包
    下载地址:https://mirrors.tuna.tsinghua.edu.cn/apache/sqoop/1.4.6/
    版本号:sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz

  • 3,上传并解压
    将 Sqoop 安装包上传到 Linux 服务器
    解压:

      tar -xvf sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz
    
  • 4,修改配置文件
    复制 sqoop-env.sh
    进入SQOOP_HOME/conf目录,进行复制

      cp sqoop-env-template.sh sqoop-env.sh
    

    修改 sqoop-env.sh

    编辑:

      vim sqoop-env.sh
    

    修改参数:在这里插入图片描述

  • 5,加入驱动包
    将MySQL 驱动包放到 SQOOP_HOME/lib 目录下
    在这里插入图片描述

  • 6, 配置环境变量
    编辑

      vim /home/shiny/.bash_profile
    

    添加内容

      export SQOOP_HOME=/home/shiny/Desktop/software/sqoop-1.4.6.bin__hadoop-2.0.4-alpha/
      export PATH=$PATH:$SQOOP_HOME/bin
    

    配置文件立即生效

      source /home/shiny/.bash_profile
    
  • 7,验证 Sqoop 是否安装成功

      sqoop-version 
      sqoop version
    

若是想去掉警告,可以修改 bin 目录下的 configure-sqoop 脚本文件,将“HCAT_HOME”和“ACCUMULO_HOME”相关信息注释掉即可。
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值