python 文档倒读/读取最新日志log/file-read-backwards

小孔不爱coding

已于 2023-04-13 15:33:50 修改

阅读量1.1k

点赞数 1

CC 4.0 BY-SA版权

文章标签： python 数据分析

于 2022-11-15 13:39:09 首次发布

本文链接：https://blog.youkuaiyun.com/weixin_52938961/article/details/127864273

本文介绍了如何使用file-read-backwards库实现按时间顺序读取不断增长的日志文件，提高查找特定IP在指定时间段内的效率，尤其适用于大文件场景。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

前些日子有位信息安全的hxd说了一个简单的需求，但我之前没有写过文件倒读，记录一下。
在这里插入图片描述
这是一个.log日志文件，会不断往里写新的内容，但每次读取要读取最新的内容，若每次都从开头读，当日志文件非常庞大的时候会一定程度上影响执行效率，那么最好得从下往上读。

实现起来比较简单，主要是用了一个之前没用过的库——file_read_backwards，直接pip install file-read-backwards即可

# pip install file-read-backwards文档倒读的库
from file_read_backwards import FileReadBackwards
import time
from interval import Interval
import datetime

def get_log(min, ip):   # 传入的参数为时间间隔和查找的ip
    end = datetime.datetime.now() # 获取当前时间
    start = end - datetime.timedelta(minutes = min)  # 当前时间-min的时间
    time_interval = Interval(start, end)  # 构成一个min的时间区间
    log_list = []   # 存储符合条件的列表
    with FileReadBackwards("AttackRequest.log") as f:  # 采用FileReadBackwards读取log文件（非常规）
        for line in f:
            # 倒序逐个判断，若不符合条件就退出循环，不必判断log中的所有字段
            # 判断是否在min内
            if datetime.datetime.strptime(line[:19], '%Y-%m-%d %H:%M:%S') in time_interval :
                # 判断是否是该ip地址
                if line[24:33] == ip:
                    # 若是，放入log_list
                    log_list.append(line)
                else:  # 若不是，continue进行下一次判断
                    continue
                pass   # pass无实际意义，只是为了换行对齐
            else:  # 若不是在时间区间，直接跳出循环，因为是倒序读取
                break
    return log_list