sqoop对于hadoop生态比较友好,可以直接将关系型数据库的数据直接同步到hdfs或hive表里面,下面我们就来一起安装一下
1.将sqoop压缩包上传到服务器上,然后解压出现一个文件名,我是自己改名成sqoop了
2,配置conf下的文件为sqoop-env.sh文件,我这里改名成sqoop-env.sh了
3,具体配置如下,可以在文件后面直接追加,改成自己的路径,我这里没有安装zookeeper,所以将这个注释掉
4,然后就是将mysql的jdbc的jar包上传到sqoop的lib目录下
上面的jar包一定要注意的是和本机装的MySQL版本一致才能成功连接MySQL库,我MySQL是5.7.33,开始用的版本是5.1.46发现不能连接后面换成5.1.24就可以连接成功,如果发现不成功都是这个jdbc的jar包版本不对,换版本就可以成功
5,如果上面第4步的jar包上传没有问题就可以测试了
测试语句如下一定要在bin目录前面执行这个操作:
bin/sqoop list-databases --connect jdbc:mysql://自己机器名,也可以是自己的机器ip:3306/ --username root --password 自己的MySQL的远程连接密码
如果测试上面的结果出现,那么恭喜你你的sqoop的安装连接MySQL成功了,连接其它的库的jar包只要找到对应的就没有问题了,如果按上面安装步骤还有别的问题欢迎留言。