kettle连接Hive配置（一）

最新推荐文章于 2024-09-12 20:05:43 发布

转载最新推荐文章于 2024-09-12 20:05:43 发布 · 2.6k 阅读

·

1

·

CC 4.0 BY-SA版权

原文链接：https://www.jianshu.com/p/ec45c21a977f

文章标签：

Hive 同时被 2 个专栏收录

7 篇文章

订阅专栏

3 篇文章

订阅专栏

本文详细介绍将MySQL数据库数据导入Hive的过程，包括启动hiveServer2、配置Kettle的plugin.properties文件、下载hive jar包及在Kettle中创建Hadoop Hive2数据库连接的具体步骤。

背景

最近需要将mysql的数据库的数据导入到hive里，期间遇到了很多坑，这次来总结一下。

步骤

1.启动hiveServer2

kettle 是通过jdbc 来连接hive的，而jdbc 方式连接hive需要启动hiveServer2（thrift接口程序）,执行如下命令来启动hiveServer2
./hive --service hiveserver2 --hiveconf hive.server2.thrift.port=10001 --hiveconf hive.server2.thrift.bind.host=[SERVER_IP]

2. 修改plugin.properties 文件

文件位置：KETTLE_HOME/plugins/pentaho-big-data-plugin/plugin.properties
修改active.hadoop.configuration=hdp25（我使用的是apache hadoop,其他版本的hadoop选择相应的版本）

3. 下载对应的hive jar包

从服务器下载hive jar文件到之前的hdp25/lib文件夹下，主要注意hive-开头的：

4.kettle里创建数据库连接

选择连接类型为hadoop hive2,填写好主机名称、数据库名称，以及之前hiveServer2的端口号，以及用户名和密码,如下：

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。