win7下借助kettle7.0在命令行界面将数据库数据传输到hive与HBASE

最新推荐文章于 2022-10-26 12:03:11 发布

kinglinch

最新推荐文章于 2022-10-26 12:03:11 发布

阅读量430

点赞数

CC 4.0 BY-SA版权

分类专栏：个人感悟

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/u014716398/article/details/85775922

接上一篇win7传输数据至hdfs

hive是基于hadoop的数据仓库，具体hive相关的内容可以查看这篇文档，使用kettle将关系型数据库导入hive或者从hive导出数据的方式有以下几种：

1、使用kettle的sqoop组件

玩过hive的人都知道，在hadoop生态圈，sqoop的作用就是将关系型数据库的数据导入到hdfs（或者将hdfs的数据导入到关系型数据库），之后使用hive命令将数据加载到hive表即可，kettle集成了sqoop插件，如下：

Kettle的sqoop插件的工作流程大概如下图（以import为例）：

这里面存在两个个问题：

Sqoop在导入数据的时候会使用Mapreduce，引文kettle运行在windows机器上，hadoop集群在linux机器，所以需要在mapred-site.xml中加入如下参数：
因为涉及到java文件的编译，就是需要集群中hadoop使用的java版本要和kettle的一致，本人在使用过程中因为hadoop集群的java版本是1.7，kettle是1.8，所以总是失败，由于不能随意更改java版本，所以这种方式不适合，并且因为这种方式其实不是最优，因此放弃使用。

2、使用jdbc将数据导入hive

Hive是hadoo

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。