最近在学习机器学习图像训练,因此从网上找了ILSVRC2012的训练图像,总大小130多G,下了半个多月才下来,下载链接如下:
magnet:?xt=urn:btih:A306397CCF9C2EAD27155983C254227C0FD938E2
由于我是用matlab进行图像训练,下面把训练前的一些预处理操作和matlab源码贴出,以备有需要的。
1、批量修改文件夹名称
ILSVRC2012_img_train.tar压缩包解压后里面有1000个子压缩包,每个压缩包对应一种物体类别的图像文件夹,在matlab训练图像时,可以用文件夹的名称作为类别名称。
ILSVRC2012_img_train.tar 子压缩包
上图看出,子文件夹的文件名称是随机的数字,因此需要先批量修改文件夹名称,在网上搜了一下没找到matlab批量修改文件的方法(本人matlab也是小白),但是找到了用python修改文件夹名称的方法,代码如下,下面的代码将文件夹的名称按照数字顺序命名.
import os
l=os.listdir(‘H:\ILSVRC2012_img_train’)
os.chdir(‘H:\ILSVRC2012_img_train’)
n=1
for i in l:
filename=str(n)
os.rename(i,filename)
n=n+1
代码运行后文件夹名称变为如下:
2、批量修改图片尺寸
下面需要将所有文件中的图片都修改为统一的大小2272273,采用m