python截取两个单词之间的内容

本文介绍了一种使用Python进行日志文件关键词匹配的方法,通过正则表达式在指定路径下的日志文件中查找两个关键词之间的内容。支持txt和log格式文件,能够处理二进制读取,适用于大型文件的关键词搜索。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1. __init__ 初始化文件路径,关键字1,关键字2;

2. key_match 使用with open 方法,以二进制方式(也可以改成utf-8,GB2312)读取文件内容(支持txt/log格式);

3. buffer = f.read() 一致性读取到buffer中,读取超大文件会发生MemoryError(可以设置每次读取的size或切割文件)。

 

#!/usr/bin/python3
# -*- coding: utf-8 -*-

import re

#文本所在路径,引号前加r指按路径处理
#关键字word1,word2,换关键字,需修改引号间的内容

class match2Words(object):
    lines=0
    def __init__(self,path,word1,word2):
        self.path = path
        self.word1 = word1
        self.word2 = word2
    def key_match(self):
        with open(self.path,'rb') as f:
            buffer = f.read()
            pattern = re.compile(self.word1+b'(.*?)'+self.word2,re.S)
            result = pattern.findall(buffer)
            if result != []:
                print(result)
                #self.lines +=1
                #print("匹配到的行数:",self.lines)
            else:
                print("没有找到你输入的关键字")

path = input("请输入要分析的log地址:")
word1 = b"begin"
word2 = b"end"
matchWords = match2Words(path, word1, word2)
matchWords.key_match()

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值