Flume TailDirSource问题

本文探讨Flume tailDirSource在日志文件名变更时出现的日志丢失问题及解决方案。通过对源码的理解与修改,避免因文件路径变化而将已存在的日志文件误判为新文件,从而实现日志的连续读取。

在使用Flume的tailDirSource时,发现每天凌晨log文件名切换时会丢失日志,查看源码发现,发现log文件名修改后不符合flume file group定义的正则表达式,导致改过名的日志文件不会再被flume读到;后来改了正则表达式,适应改名后的log文件,但发现改名后的log文件会被flume当成新文件,重新读一遍,再看源码,发现tailDirSource通过inode和filePath两个维度来判断是否为新文件,log改名后,filePath不一样,就被tailDirSource视为新的文件,重新读一遍,好了,看下源码怎么修改?

flume-taildir-source工程ReliableTaildirEventReader.java 247行

if (tf == null || !tf.getPath().equals(f.getAbsolutePath())) {
    ...
}

!tf.getPath().equals(f.getAbsolutePath()) 这个比较filePath的代码去掉即可!

评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值