在使用Flume的tailDirSource时,发现每天凌晨log文件名切换时会丢失日志,查看源码发现,发现log文件名修改后不符合flume file group定义的正则表达式,导致改过名的日志文件不会再被flume读到;后来改了正则表达式,适应改名后的log文件,但发现改名后的log文件会被flume当成新文件,重新读一遍,再看源码,发现tailDirSource通过inode和filePath两个维度来判断是否为新文件,log改名后,filePath不一样,就被tailDirSource视为新的文件,重新读一遍,好了,看下源码怎么修改?
flume-taildir-source工程ReliableTaildirEventReader.java 247行
if (tf == null || !tf.getPath().equals(f.getAbsolutePath())) {
...
}
把 !tf.getPath().equals(f.getAbsolutePath()) 这个比较filePath的代码去掉即可!
本文探讨Flume tailDirSource在日志文件名变更时出现的日志丢失问题及解决方案。通过对源码的理解与修改,避免因文件路径变化而将已存在的日志文件误判为新文件,从而实现日志的连续读取。
1092





