项目需求,需要Oracle、Hive之间的数据同步,Kettle连接Hive,坑比较多,Mark下。
一、环境说明
我的大数据集群环境使用的Cloudera,CDH版本为5.14,其他为,
- kettle的版本是:8.2
- hadoop:2.6.0
- hive:1.1
二、Hive配置信息
1、到Cloudera manager界面,选择Hive,下载客户端配置,

2、解压配置文件

3、然后将解压的配置文件复制到kettle的安装目录下,我的路径是:D:\data-integration\plugins\pentaho-big-data-plugin\hadoop-configurations\cdh514

三、所需 jar 包
配置文件搞定后,启动报错,还缺两个hadoop的依赖包,hadoop-core.jar和hadoop-common.jar。
放上依赖jar后,重启,测试成功。

本文介绍在Cloudera CDH 5.14环境下,使用Kettle 8.2进行Oracle与Hive间数据同步的过程。涉及Hive客户端配置下载、解压及复制到Kettle安装目录,以及解决启动时缺少hadoop-core.jar和hadoop-common.jar依赖的问题。
2782





