原创博客,转载请注明出处!
PyTorch是一个最近出的功能比较强大的框架。
torchvision和torch包是PyTorch框架比较重要的两个包,其中torchvision包括下面四部分
1. torchvision.datasets : 图片、视频等数据集的加载器
2. torchvision.models : 常见网络模型的定义,如Alexnet、VGG、Resnet以及它们的与训练模型
3. torchvision.transforms : 常见的图像转换工具,如随机裁剪、旋转等
4. torchvision.utils : 工具类,如保存张量(3 x h x w)作为图像到磁盘,给一个小批量创建一个图像网格等
准备工作:
数据可以有两种方式存放:
第一种:图片文件夹+txt文档
通过txt文档映射它们的关系。
第二种:训练集和测试集分开,且每一类文件都放在同一子目录下
即目录下一般包括两个文件夹:train和val,每个文件件下面包含N个子文件夹,N是你的分类类别数,且每个子文件夹里 存放的就是这个类别的图像。比如N = 3 ,那么文件夹目录可以是这样
data/
train/
man/xxxx.jpg
man/yyyy.jpg
dog/111.jpg
cat/222.jpg
...
val/
man/111.jpg<