非kerberos环境下，flume采集日志到kafka

最新推荐文章于 2024-11-24 06:00:00 发布

转载最新推荐文章于 2024-11-24 06:00:00 发布 · 182 阅读

0 ·

CC 4.0 BY-SA版权

原文链接：http://blog.51cto.com/12473494/2420857

文章标签：

#大数据

本文介绍如何使用Flume将本地文件的日志数据实时读取并发送至Kafka主题，通过配置Flume的agent、source、channel、sink等组件实现数据的高效传输。详细展示了kafkaflume.conf配置文件的参数设定，包括Kafka的broker地址、主题名、序列化方式及压缩类型等。

kafkaflume.conf

agent.sources = s1
agent.channels = c1
agent.sinks = k1

agent.sources.s1.type=exec
agent.sources.s1.command=tail -F /usr/local/src/flume/testflume2.log
agent.sources.s1.channels=c1
agent.channels.c1.type=memory
agent.channels.c1.capacity=10000
agent.channels.c1.transactionCapacity=100

#设置Kafka接收器
#
agent.sinks.k1.type = org.apache.flume.sink.kafka.KafkaSink
##设置Kafka的broker地址和端口号
agent.sinks.k1.kafka.bootstrap.servers = master:9092,node01:9092,node02:9092
##设置Kafka的Topic
agent.sinks.k1.kafka.topic = mydemo5
##设置序列化方式
#
#
agent.sinks.k1.kafka.flumeBatchSize = 20
agent.sinks.k1.kafka.producer.acks = 1
agent.sinks.k1.kafka.producer.linger.ms = 1
agent.sinks.ki.kafka.producer.compression.type = snappy

agent.sinks.k1.channel=c1

创建一个topic

kafka-topics --create --zookeeper master:2181/kafka --replication-factor 2 --partitions 3 --topic mydemo5

启动flume作为消息生产者写道kafka上

flume-ng agent -c conf -f kafkaflume.conf -n agent -Dflume.root.logger=INFO,console

消费kafka的数据

kafka-console-consumer --bootstrap-server master:9092 --topic mydemo5 --from-beginning

读取一个文件的内容写入追加到新的文件

#!/bin/bash

while read line
do
    echo $line
    sleep 0.01
    echo -e $line >> /usr/local/src/flume/testflume2.log
done < /etc/sudo-ldap.conf

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

bennuo2431

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

【硬刚Kafka】KAFKA基础（十五）：Flume对接Kafka

微信搜：import_bigdata，大数据领域硬核原创作者

09-23

561

本文是对《【硬刚大数据之学习路线篇】从零到大数据专家的学习指南(全面升级版)》的Kafka：部分补充。 1简单实现 1）配置flume # define a1.sources = r1 a1.sinks = k1 a1.channels = c1 # source a1.sources.r1.type = exec a1.sources.r1.command = tail -F /opt/module/data/flume.log # sink a1.sinks.k1.type = org..

java flume hbase_如何在Kerberos环境下使用Flume采集Kafka数据写入HBase

weixin_32999397的博客

02-24

326

内容概述1.环境准备2.配置Flume Agent3.流程测试4.总结测试环境1.CM和CDH版本为5.12.12.采用root用户操作前置条件1.Flume已安装2.HBase和Kafka已安装且已启用Kerberos3.集群已启用Kerberos2.环境准备1.编写向Kafka生成数据的ReadUserInfoFileToKafka.java代码，具体内容可以在Fayson的GitHub上查看...

参与评论您还未登录，请先登录后发表或查看评论

Kafka关键知识点概括，命令，参数，javaDemo

静待花开

07-17

829

kafka -------------- 分布式流处理平台。在系统之间构建实时数据流管道。以topic分类对记录进行存储每个记录包含key-value+timestamp 每秒钟百万消息吞吐量。 producer //消息生产者 consumer //消息消费者 consumer ...

基础大杂烩

weixin_51192399的博客

04-08

1589

TLQ7/8 常用命令说明

zero__wu的博客

02-21

6194

说明：本文档适用于 TongLINk/Q 7.X 和 8.X 各个平台的 server 端。用来查看 TongLINK/Q 的各个状态。下文中，TongLINK/Q7.x 和 TongLINK/Q8.x 通称为为 TLQ。 1. 启停启动顺序：先启动 TLQ，再启动应用程序。停止顺序：先停应用程序，再停止 TLQ。启动命令：tlq 停止命令：tlq -cstop -y 强制停止：tlq -cabort -y -w1 2. 查看 TLQ 节点 License 信息命令：tlqstat –lic 执

TongLINK/Q7.X 8.x查看队列情况命令

realliuxin的博客

04-21

5575

说明：本文档适用于TongLINk/Q 7.X和8.X各个平台的server端。用来查看TongLINK/Q的各个状态。下文中，TongLINK/Q7.x和TongLINK/Q8.x通称为为TLQ。 Create by liuxin 启停：启动顺序：先启动TLQ，再启动应用程序。停止顺序：先停应用程序，再停止TLQ。启动命令：tlq 停止命令：tlq -cstop -y 强制停止：tlq -cabort -y -w1 2.查看TLQ节点License信息命令：...

一次flume exec source采集日志到kafka因为单条日志数据非常大同步失败的踩坑带来的思考

HuaZi_Myth的博客

11-07

4810

本次遇到的问题描述，日志采集同步时，当单条日志（日志文件中一行日志）超过2M大小，数据无法采集同步到 kafka，分析后，共踩到如下几个坑。 1、flume采集时，通过shell+EXEC（tail -F xxx.log 的方式） source来获取日志时，当单条日志过大超过1M时，source端无法从日志中获取到Event。 2、日志超过1M后，flume的kafka sink 作为生产者发送给...

Flume 与 Kafka 整合实战

天冬忘忧的博客

11-24

2700

在大数据处理的生态系统中，Flume 和 Kafka 都是非常重要的组件。Flume 擅长收集、聚合和传输大量的日志数据等，而 Kafka 则是一个高性能的分布式消息队列，能够处理海量的实时数据。将 Flume 和 Kafka 进行整合，可以构建强大的数据处理管道，实现数据的高效采集、传输和处理。本文将详细介绍 Flume 和 Kafka 整合的两种常见方式：Kafka 作为 Source 和 Kafka 作为 Sink。

Flume使用大全之kafka source-kafka channel-hdfs(kerberos认证)

xiaoji88326518的专栏

08-07

2562

agent.sources = kafkaSource1 agent.channels = kafkaChannel agent.sinks = hdfsSink agent.sources.kafkaSource1.channels = kafkaChannel agent.sinks.hdfsSink.channel = kafkaChannel agent.sour

Flume使用大全之kafka source-kafka channel-hdfs(kerberos认证，SSL加密)

xiaoji88326518的专栏

08-07

1547

agent.sources = kafkaSource1 agent.channels = kafkaChannel agent.sinks = hdfsSink agent.sources.kafkaSource1.channels = kafkaChannel agent.sinks.hdfsSink.channel = kafkaChannel agent.sour

使用SPRING BOOT 调用TLQRemoteApi，实现 TLQ动态管理

09-21

##################################1、工程说明#################################### 1) 本工程演示了通过SPRING BOOT实现TLQ一站式配置功能 2) 一站式配置简化了配置TLQ的复杂度，降低TLQ配置出错概率。所有对象的创建及删除均一步完成，动态生效，无需重启;

TongLinkQ（TLQ）消息中间件使用总结——记那几天趟过的坑

热门推荐

秃了也弱了

06-16

3万+

引出问题为了系统间安全的传输文件，公司决定用消息中间件——TLQ来作为文件传输的中间件。第一次听说这个中间件，内心充满了疑惑。从网上查了一下资料，疑惑不光没减多少，反而更疑惑了，因为根本就没啥资料！！ TLQ架构发送方和接收方都需要安装TLQ的服务端，发送方和接收方之间是依赖TLQ的核心通信的。其逻辑为：发送方代码->发送方TLQ核心->接收方TLQ核心->接收方代码。其中TLQ核心之间的通信不需要人为关心，只需要关心如何用代码将消息发送或接收本地的TLQ消息即可。

flume 1.6 发数据到kafka的kafka sink的配置

请叫我大师兄

12-01

1710

数据经过flume发送到kafka的配置，flume版本是1.6的时候的配置例子 agent.sources = s1 agent.channels = c1 agent.sinks = k1 agent.sources.s1.type = spooldir agent.sources.s1.channels = c1 agent.sources.s1.spoolDir = /root/data/ttm agent.sources.s1.selector.type = com.x.y.collecto

flume+kafka配置测试流程

budingningmeng的专栏

07-24

488

1、配置flume里的conf文件 [root@Zk-robot-2 kafka]# cd /opt/flume-1.8.0/conf/ [root@Zk-robot-2 conf]# vi flume_to_kafka.conf #配置agent agent1.sources=source1 agent1.channels=channel1 agent1.sinks=sink1 #配置so...

flume kafka sink 抛出异常 Bootstrap Servers must be specified

chilai4545的博客

08-07

3379

使用flume kafka sink时，启动flume抛出异常 Sink kafkasink has been removed due to an error during configuration org.apache.flume.conf.ConfigurationExceptio...

flume+hbase+kafka集成部署

梦想天空

09-10

1306

目录一、架构图二、flume的安装和配置 1. 下载安装 2. 配置 2.1 日志收集节点配置 2.2 日志聚集节点配置 2.3 Flume的二次开发三、模拟程序开发四、服务启动测试 1. 服务启动 1.1 zookeeper 1.2 HDFS 1.3 Hbase 1.4 kafka 2. 测试 Flume是一个高可用的，高可靠的，分布式的海量日志采集、聚合...

Flume中从kafkasource分配数据到kafkaSink时，topic被覆盖问题

莫忘莫忧的博客

11-09

2501

问题：当kafkasource和kafkasink一起使用时，传输到kafkasink的数据，被传到了kafkasource。即陷入死循环，从 kafkasource 读取的数据被flume 重新传到kafkasource。原因当flume从kafka里读取的数据时，消息上会event headers结构。在events header中会自动带上，topic:‘topic名称’。如：而kafka sink的中 allowTopicOveride参数默认为true，即会使用topichead

Flume - 初用Flume 1.8.0

用时间去蜕变

04-18

1691

Flume - 初用Flume 在Flume中，最重要的三个部件分别为： source channels sink 在本例中我们使用如图的架构来进行Flume数据采集：当前使用的flume版本号为1.8.0，如果相对其他类别的配置有更详细的了解，可查看：http://flume.apache.org/FlumeUserGuide.html 对于flume中的使用主要是对于配置文...

Kafka实现应用日志实时上报统计分析

长沙老码农

03-04

3329

目录 1、Flume插件 1.1 简介 1.2 安装 1.3 配置 1.4 测试 2、Flume集成Kafka 2.1 配置kafka信息 2.2 启动zookeeper，kafka，flume 2.3 测试 3、Flume生产日志收集 3.1 日志收集配置 3.2 测试 4、Fink安装和简单实用 4.1 概述 4.2 安装配置 4.3 启动测试 4.4 体验Flink 5、Flink集成Kafka 5.1 引入pom依赖 5.2 创建一个Flink任务执行类.

flume采集kafka数据写入hdfs