kettle6.0 hadoop hbase交互记录

摘要:在kettle6.0中连接读写hadoop和hbase与之前版本方法不同,故记录一下使用方法。

环境准备:

windows kettle6.0
jdk1.7
hadoop 2.6.5
hbase 1.2.6

配置

首先配置hadoop的连接插件
打开

工具->hadoop distribute

原生hadoop选择CDH5.4
这里写图片描述

接下来新建一个hadoop连接配置,username和password可以忽略,我们只需要连接到hdfs即可。配置完后进行test,如图几个关键项通过即可。
new
config
test

读写操作

hdfs Hadoop file input

在左侧transform树中,找到big data(大数据)一栏,将输入“hadoop file
input”拖入操作板中,再设置一个输出目的,这里我选择输出到本地txt文件中。

result

双击点开hadoop file input,配置输入文件,这边我随意选择了一个配置文件

这里写图片描述

接下来配置数据处理方式,
这边需要配置输出字段这个sheet,不然你啥也别想得到╮(╯▽╰)╭

这里写图片描述

这里写图片描述

输出

这里写图片描述

Hadoop file output(mysql读取)

mysql的配置以及读入读出前面《kettle6.0基础功能实战》中都有介绍,配置mysql连接,再使用表输入即可这里就不多说了。

file

这里写图片描述

这里写图片描述

写入hdfs要注意一下目录权限问题

这里写图片描述

配置完成后执行

这里写图片描述

这里写图片描述

Hbase读入

这里写图片描述

1、选择cluster以及hbase文件
2、配置mapping
选择一张表,并为其命名一个mapping,然后配置相关字段
3、选择mapping

这里写图片描述

Hbase output

配置同input

Tips:
1、上一步骤输入的数据必须要出现在写入mapping里,否则会报Cant find incoming错误,如果不需要写入上一步骤全部字段,可以用过滤。
2、famliy必须先创建,columns可以不用

这里写图片描述

这里写图片描述

总览

这里写图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值