Gobblin部署--standalone模式

本文介绍了如何在本机以Standalone模式部署Gobblin,用于从Kafka抽取数据并输出到本地文件系统。部署步骤包括下载Gobblin,配置环境变量,创建目录并添加配置文件,最后以Standalone模式运行Job。配置文件设置是关键,数据将被输出到指定的工作目录。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在本机部署gobblin,可以使用standalone模式。这将使得从kafka抽取的数据,输出到本地文件系统中。

1、下载Gobblin

对于standalone模式,有2种部署方法:

1、直接下载预编译的版本
2、下载源码,手动编译

我们这里简单起见,直接使用Gobblin编译好的版本:gobblin-distribution-0.8.0.tar.gz

2、安装Gobblin

解压:

tar -zxvf software/gobblin-distribution-0.8.0.tar.gz 

更改目录名称:

mv gobblin-dist/ gobblin

3、更改环境变量

确保已经配置了JAVA_HOME;

添加如下2个环境变量到bashrc中:

export GOBBLIN_JOB_CONFIG_DIR=/home/flink/gobblin/gobblin_conf_dir
export GOBBLIN_WORK_DIR=/home/flink/gobblin/gobblin_work_dir

立即生效:

source ~/.bashrc

4、创建目录,添加配置文件

创建GOBBLIN_JOB_CONFIG_DIR以及GOBBLIN_WORK_DIR所在的目录:

mkdir gobblin_conf_dir
mkdir gobblin_work_dir

在GOBBLIN_JOB_CONFIG_DIR中添加如下配置文件(以.pull或者.job结尾):

[flink@cninfo gobblin_conf_dir]$ cat standalone.pull 
job.name=GobblinKafkaQuickStart
job.group=Gobblin
job.description=Gobblin quick start job for Kafka
job.lock.enabled=false
kafka.brokers=flink:9092,data0:9092,mf:9092
source.class=gobblin.source.extractor.extract.kafka.KafkaSimpleSource
extract.namespace=gobblin.extract.kafka

writer.builder.class=gobblin.writer.SimpleDataWriterBuilder
writer.file.path.type=tablename
writer.destination.type=HDFS
writer.output.format=txt

data.publisher.type=gobblin.publisher.BaseDataPublisher

topic.whitelist=test
simple.writer.delimiter=\n


mr.job.max.mappers=1

metrics.reporting.file.enabled=true
metrics.log.dir=${env:GOBBLIN_WORK_DIR}/metrics
metrics.reporting.file.suffix=txt

bootstrap.with.offset=earliest
[flink@cninfo gobblin_conf_dir]$ 

这里主要注意3个地方:

kafka.brokers : kafka brokers的列表
topic.whitelist=test : 代表想要抽取的topic的名字
simple.writer.delimiter=\n : 代表每一行就是一个message消息,回车结尾

5、以standalone模式运行Job

[flink@cninfo bin]$ gobblin-standalone.sh start

数据被输出到GOBBLIN_WORK_DIR目录下的job-output:
这里写图片描述

6、总结

gobblin standalone模式的部署相对来讲比较简单,下一篇文章将重点介绍如何部署mapreduce模式。

参考:
Gobblin采集kafka数据
Configuration Glossary
Deployment

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值