Flume系列:Flume Sink使用

本文介绍了Apache Flume中Sink的使用,重点讲解了HDFS Sink处理小文件的问题及其影响,包括元数据和计算层面的挑战,并提出了通过配置参数控制小文件生成的解决方案。此外,还提及了logger Sink的启动方式以及如何利用kafka channel将数据写入Kafka。

目录

Apache Hadoop生态-目录汇总-持续更新

1:HDFS Sink

HDFS小文件的处理

HDFS存入大量小文件的影响:

HDFS小文件处理:

2:logger Sink

3:写入Kafka - 可以使用kafka channel代替


Apache Hadoop生态-目录汇总-持续更新

系统环境:centos7

Java环境:Java8

Sink 不断地轮询 Channel 中的事件且批量地移除它们,并将这些事件批量写入到存储或索引系统、或者被发送到另一个 Flume Agent。

Sink 组件目的地包括 hdfs、logger(常用语测试)、avro、thrift、ipc、file、HBase、solr、自定义。

 

1:HDFS Sink

# 1:定义组件
kafka_flume_hdfs.sources = r1
kafka_flume_hdfs.channels = c1
kafka_flume_hdfs.sinks = k1

# 2:定义source
这里主要介绍Channel顾这里省略,到source模块查看写法

# 3:定义channel
这里主要介绍sources顾这里省略,到channel模块查看写法

# 4:定义sink
kafka_flume_hd
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

iwester

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值