参考项目地址:https://github.com/MachineLP/PyTorch_image_classifier
一:数据检查和增删
记住每类数据集不能太少,也不能为空,否则会造成训练数据时的索引出现偏差,每类至少有20张。
二:对每张图片进行重命名
在Resnext-pytorch/process_data/rename.py
先把名字随便改一下
然后再统一改回来
三:数据的上传解压
将整个文件夹放在/data目录下,名字为img
对文件或者文件夹重命名都可以用mv oldname newname
四:图片的检查
把一些空的,出错的图片删除:tools/check.py
五、开始训练
python data/debug.py
查看类别数是否相同
1、生成csv文件 tools/write_csv.py
2、生成训练所需要的格式
python tools/data_preprocess.py --data_dir "./data/data_train.csv"