经常下载不同的数据集,发现很多数据集经常是文件夹下有很多子文件夹代表着类别,如1,2,3……,子文件夹下就放着该类的特征文件。因为系统读取文件夹时并不是严格意义上的升序,而是1,10,100……20,21……的形式。要想对这样的特征文件进行重命名并将其放到一个目录下,并且考虑格式的问题,首先要做的就是将父类的文件夹进行重命名。
对子文件夹的命名
原来的文件目录如下:
用Python写脚本,程序如下:
#coding:utf8
import os
import shutil
def folder_rename(path):
i = 0
filelist = os.listdir(path) # 该文件夹下所有的文件(包括文件夹)
for files in filelist: # 遍历所有文件
i = i + 1
Olddir = os.path.join(path, files) # 原来的文件路径
if os.path.isdir(Olddir): # 如果是文件夹
filename = os.path.splitext(files)[0] # 文件名
a = int(filename)
if a < 10:
b = '00' + filename
elif a > 9 and a < 100 :
b = '0' + filename
else:
b = filename
path_1 = path + '/'
os.rename(path