### 最近在开发中有一个实际问题是,经常会有上千个.ksc文件(类似.txt)需要提取文件内容将并将文件内容写入其他目标文件中,最终读取目标文件字段提高开发效率。
### 这里体会到了python的便捷和正则的强大之处
import os
import re
erroFile = []
kscTxt = open("C:/Users/new/Desktop/ksc/ksc.txt", mode='w', encoding='utf-8')
for root, dirs, files in os.walk("C:/Users/new/Desktop/ksc/ksc", topdown=True):
if os.listdir(root): #top文件夹不为空文件夹
for f in files: #遍历所有文件
kscFile = open("C:/Users/new/Desktop/ksc/ksc/"+f, mode='r', encoding='utf-8')
try:
content = kscFile.readlines()
print(''.join(content))
print(type(content)) #读出的文件是个list因此下面正则时需要通过''.join()转换成String
tag = re.search("karaoke.tag\('colors', '[0-9]+'\)", ''.join(content)).group()
kscTxt.write("{\""+f+"\" : "+"\""+re.search("[0-9]+", tag).group()+"\"}"+'\n')
except Exception as e:
print("erro ..."+str(e))
fileName = {"name": f}
erroFile.append(fileName)
finally:
print("finally ...")
kscFile.close()
kscTxt.close()
print(erroFile) #读取有问题的文件