最近做数据预处时,需要将提取Excel中的图像,为了保证提取出来的图像质量,需要先将'.xlsx文件都重命名为'.zip'文件,在该zip文件中'xl\media'路径下就存放着所需要的图像文件,如下图所示。

重命名的代码如下:
import os
path = r'C:\workspace\data'
count = 1
for file in os.listdir(path):
new_file = file.replace(".xlsx",".zip")
os.rename(os.path.join(path,file),os.path.join(path,new_file))
count+=1
之后要做的就是将.zip文件里的图像读取出来并保存,直接看如下代码
import zipfile
import os
from PIL import Image
import numpy as np
number = 0
craterDir = "data/" # 存放zip文件的文件夹路径
saveDir = "images/" # 存放图片的路径
list_dir = os.listdir(craterDir) # 获取所有的zip文件名
for zip_name in list_dir:
print(zip_name)
# 默认模式r,读
azip = zipfile.ZipFile(craterDir + zip_name)
# 返回所有文件夹和文件
namelist = (azip.namelist())
for idx in range(0,len(namelist)):

最低0.47元/天 解锁文章
802

被折叠的 条评论
为什么被折叠?



