基于卷积神经网络（CNN）的猫狗识别系统

最新推荐文章于 2024-06-21 19:02:15 发布

原创最新推荐文章于 2024-06-21 19:02:15 发布 · 1.2k 阅读

20 ·

CC 4.0 BY-SA版权

文章标签：

#cnn #人工智能 #神经网络

部署运行你感兴趣的模型镜像

实验步骤：

卷积神经网络（Convolutional Neural Networks）：一种深度学习模型或类似于人工神经网络的多层感知器，常用来分析视觉图像。

如上图所示，卷积神经网络架构与常规人工神经网络架构非常相似，特别是在网络的最后一层，即全连接。此外，还注意到卷积神经网络能够接受多个特征图作为输入，而不是向量。

2. 理论学习：

一个卷积神经网络主要由以下5层组成：

数据输入层/ Input layer：该层要做的处理主要是对原始图像数据进行预处理

卷积计算层/ CONV layer：这一层就是卷积神经网络最重要的一个层次，也是“卷积神经网络”的名字来源。

ReLU激励层 / ReLU layer：把卷积层输出结果做非线性映射

池化层 / Pooling layer：池化层夹在连续的卷积层中间，用于压缩数据和参数的量，减小过拟合。简而言之，如果输入是图像的话，那么池化层的最主要作用就是压缩图像。

全连接层 / FC layer：两层之间所有神经元都有权重连接，通常全连接层在卷积神经网络尾部。

3. 数据收集：

通过tensorflow框架的keras.preprocessing.image获取1000张猫和1000张狗的图片作为训练集，再获取500张狗和500张猫的图片作为验证集。关键代码如下图所示：

4. 数据预处理：

设置数据生成器，它将读取源文件夹中的图片，将它们转换为张量，并将它们以及它们的标签提供给神经网络。所有会得到一个用于训练图像的生成器和一个用于验证图像的生成器。这个生成器将批量生成 20 张大小为 150*150 的图像及其标签。

进入神经网络的数据通常应该以某种方式标准化，以使其更易于被神经网络处理。在我的代码中，通过将像素值归一化为 [0,1] 范围内来预处理我们的图像。关键代码如下图：

5. 算法实现步骤：

导入库：
1. 导入了TensorFlow库，用于构建和训练深度学习模型。
2. 导入了操作系统库（os），用于处理文件路径等操作。
3. 导入了RMSprop优化器，用于模型的编译。
定义文件路径：
1. 定义了训练集和验证集的文件路径，以及猫和狗图片的子目录路径。
加载数据：
1. 使用os.listdir函数加载了训练集中猫和狗的文件名，并打印了部分文件名和图片数量。
构建卷积神经网络模型：
1. 使用Sequential模型，顺序地堆叠各层。
2. 添加了3个卷积层（Conv2D），每个卷积层后跟一个ReLU激活函数。
3. 在每个卷积层后添加了最大池化层（MaxPooling2D）。
4. 将图像展平为一维向量（Flatten）。
5. 添加了两个全连接层（Dense），分别用于特征提取和分类，最后一层使用Sigmoid激活函数输出分类概率。
模型编译：
1. 使用RMSprop优化器进行模型编译。
2. 损失函数选择了二元交叉熵（binary_crossentropy）。
3. 评估指标为准确率（acc）。
数据预处理：
1. 使用ImageDataGenerator进行数据预处理，将像素值缩放到[0,1]之间。
生成数据批次：
1. 使用flow_from_directory方法生成训练和验证数据的批次。
定义模型检查点：
1. 设置保存模型权重的文件路径和目录。
2. 创建一个ModelCheckpoint回调，用于在训练过程中保存模型的权重。
模型训练：
1. 调用fit_generator方法进行模型训练。
2. 设置训练参数，包括训练数据生成器、验证数据生成器、训练步数、迭代次数、验证步数等。
3. 添加模型检查点回调，以便在训练过程中保存模型的权重。