python实现读取大量文件并通过正则识别文件内容并生成新的文件

本文介绍了一种使用Python和正则表达式批量处理上千个ksc文件的方法,旨在从文件中提取特定信息并将其整合到单一的目标文件中,以此提高开发效率。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

###    最近在开发中有一个实际问题是,经常会有上千个.ksc文件(类似.txt)需要提取文件内容将并将文件内容写入其他目标文件中,最终读取目标文件字段提高开发效率。

###    这里体会到了python的便捷和正则的强大之处

import os
import re
erroFile = []
kscTxt = open("C:/Users/new/Desktop/ksc/ksc.txt", mode='w', encoding='utf-8')
for root, dirs, files in os.walk("C:/Users/new/Desktop/ksc/ksc", topdown=True):
    if os.listdir(root):    #top文件夹不为空文件夹
        for f in files:      #遍历所有文件
            kscFile = open("C:/Users/new/Desktop/ksc/ksc/"+f, mode='r', encoding='utf-8')
            try:
                content = kscFile.readlines()
                print(''.join(content))
                print(type(content))    #读出的文件是个list因此下面正则时需要通过''.join()转换成String
                tag = re.search("karaoke.tag\('colors', '[0-9]+'\)", ''.join(content)).group()
                kscTxt.write("{\""+f+"\" : "+"\""+re.search("[0-9]+", tag).group()+"\"}"+'\n')
            except Exception as e:
                print("erro ..."+str(e))
                fileName = {"name": f}
                erroFile.append(fileName)
            finally:
                print("finally ...")
            kscFile.close()
kscTxt.close()
print(erroFile)     #读取有问题的文件

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值