经典卷积模型回顾14—vgg16实现图像分类（tensorflow）

share_data

已于 2023-03-10 21:20:17 修改

阅读量2.9k

点赞数

文章标签： tensorflow 深度学习分类

于 2023-03-10 21:19:16 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/ncusz/article/details/129453343

版权

文章介绍了VGG16模型的结构特点，包括其深度、3x3卷积核和大量卷积层的设计，以及在ILSVRC比赛中的优秀表现。在TensorFlow2中，通过6个步骤展示了如何使用VGG16进行花类图像的分类，包括数据预处理、模型构建、训练和结果可视化。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

VGG16是由牛津大学计算机视觉小组（Visual Geometry Group）开发的深度卷积神经网络模型。其结构由16层组成，其中13层是卷积层，3层是全连接层。

VGG16被广泛应用于各种计算机视觉任务，如图像分类、目标检测和人脸识别等。其在ImageNet Large Scale Visual Recognition Challenge (ILSVRC)比赛中取得了第一名的成绩，准确率达到了92.7%。

VGG16的主要特点是：

- 模型非常深，卷积层13层，全连接层3层，共有138M参数，能够提取出更多的图像特征；

- 所有卷积层都是3x3大小的卷积核和1个像素的步幅，这种设计可以得到更小的卷积层，并且每层都可以学到更多的特征；

- 采用了大量的卷积层，可以逐步提取出更加抽象、高级别的特征，提高了模型的准确率；

- 采用了局部响应归一化（Local Response Normalization）层，强化了模型的泛化能力；

- 采用了Dropout技术，减少了模型的过拟合。

总之，VGG16是一个非常经典的深度卷积神经网络模型，被广泛应用于各种计算机视觉任务，并且在该领域取得了极大的成功。

下面是vgg16在TensorFlow 2中实现花类图像分类的步骤：

步骤1：导入必要的库

```

import tensorflow as tf

from tensorflow.keras import datasets, layers, models

import matplotlib.pyplot as plt

```

步骤2：准备数据集

下载花类数据集，这里使用TensorFlow自带的花类数据集。

```

(train_images, train_labels), (test_images, test_labels) = datasets.flowers.load_data()

```

步骤3：数据预处理

将图像数据归一化，并将标签进行one-hot编码。

```

train_images, test_images = train_images / 255.0, test_images / 255.0

train_labels = tf.keras.utils.to_categorical(train_labels, num_classes=5)

test_labels = tf.keras.utils.to_categorical(test_labels, num_classes=5)

```

步骤4：定义模型

定义vgg16模型，包括13个卷积层和3个全连接层。

```

model = models.Sequential([

layers.Conv2D(64, (3, 3), activation='relu', input_shape=(224, 224, 3), padding='same'),

layers.Conv2D(64, (3, 3), activation='relu', padding='same'),

layers.MaxPooling2D((2, 2)),

layers.Conv2D(128, (3, 3), activation='relu', padding='same'),

layers.Conv2D(128, (3, 3), activation='relu', padding='same'),

layers.MaxPooling2D((2, 2)),

layers.Conv2D(256, (3, 3), activation='relu', padding='same'),

layers.Conv2D(256, (3, 3), activation='relu', padding='same'),

layers.Conv2D(256, (3, 3), activation='relu', padding='same'),

layers.MaxPooling2D((2, 2)),

layers.Conv2D(512, (3, 3), activation='relu', padding='same'),

layers.Conv2D(512, (3, 3), activation='relu', padding='same'),

layers.Conv2D(512, (3, 3), activation='relu', padding='same'),

layers.MaxPooling2D((2, 2)),

layers.Conv2D(512, (3, 3), activation='relu', padding='same'),

layers.Conv2D(512, (3, 3), activation='relu', padding='same'),

layers.Conv2D(512, (3, 3), activation='relu', padding='same'),

layers.MaxPooling2D((2, 2)),

layers.Flatten(),

layers.Dense(4096, activation='relu'),

layers.Dense(4096, activation='relu'),

layers.Dense(5, activation='softmax')

])

```

步骤5：编译和训练模型

设置优化器、损失函数和评估指标，并进行模型训练。

```

model.compile(optimizer='adam',

loss='categorical_crossentropy',

metrics=['accuracy'])

history = model.fit(train_images, train_labels, epochs=20,

validation_data=(test_images, test_labels))

```

步骤6：可视化训练结果

通过可视化训练结果，可以了解模型的训练效果。

```

plt.plot(history.history['accuracy'], label='accuracy')

plt.plot(history.history['val_accuracy'], label = 'val_accuracy')

plt.xlabel('Epoch')

plt.ylabel('Accuracy')

plt.ylim([0, 1])

plt.legend(loc='lower right')

```

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

share_data 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。