基于卷积神经网络的CIFAR10图像分类训练
一、数据集介绍
CIFAR10是一个用于图像识别的10分类彩色数据集,每张图片32x32的像素,每种对应有6000张图片,共60000张的数据中50000张训练集和10000张测试集。
二、基础模型
采用简单网络结构,卷积核大小统一采用3*3,具体如下:
第一层:32个卷积核的卷积层、dropout层(0.3)、池化层
第二层:64个卷积核的卷积层、dropout层(0.3)、池化层
全连接层及输出层
**epochs=40,batch_size=128**
,训练结果如下:
- 结论:训练集上达到97%时,测试集仅72.3%,模型明显过拟合,针对这个问题进行改进。
三、模型优化与数据处理
1. 数据增强
datagen = tf.keras.preprocessing.image.ImageDataGenerator(rescale=None,rotation_range=15,width_shift_range=0.1,
height_shift_range=0.1,shear_range=0.1zoom_range=0.1,
horizontal_flip=True,fill_mode='nearest')
datagen.fit(x_img_train)
2. 网络结构优化
- 新增64核卷积层、128核卷积层、256核卷积层各一层
- 各层网络中间增加几层dropout防止过拟合
model = tf.keras.Sequential()
model.add(tf.keras.layers.Conv2D(filters=64,kernel_size=(3,3)