21、卷积神经网络：从图像分类到特征检测

z2a3b4c5d

于 2025-08-01 10:09:31 发布

阅读量21

点赞数

CC 4.0 BY-SA版权

分类专栏： PyTorch深度学习实战文章标签：卷积神经网络 CNN 图像分类

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/z2a3b4c5d/article/details/151033968

PyTorch深度学习实战专栏收录该内容

51 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

卷积神经网络：从图像分类到特征检测

1. 图像分类与深度学习基础

在图像分类任务中，深度学习发挥着重要作用。计算机视觉是深度学习应用最为广泛的领域之一，有许多带注释的图像数据集可供使用，其中很多可以通过 torchvision 访问。 Datasets 和 DataLoaders 为加载和采样数据集提供了简单而有效的抽象。

对于分类任务，在网络输出上使用 softmax 函数可以产生满足概率解释要求的值。在这种情况下，理想的损失函数是将 softmax 的输出作为非负对数似然函数的输入，在PyTorch中， softmax 和这种损失的组合被称为交叉熵。

我们可以将图像视为像素值的向量，使用全连接网络来处理它们，就像处理其他数值数据一样。然而，这样做很难利用数据中的空间关系。简单的模型可以使用 nn.Sequential 创建。

2. 全连接网络的问题

在之前的尝试中，我们构建了一个简单的神经网络，它可以拟合（或过拟合）数据，这得益于线性层中可用于优化的众多参数。但该模型存在问题，它更擅长记忆训练集，而不是泛化鸟类和飞机的特征。

由于需要全连接设置来检测图像中鸟类或飞机的各种可能平移，我们面临两个问题：一是参数过多，这使得模型更容易记忆训练集；二是缺乏位置独立性，这使得模型难以泛化。虽然我们可以通过使用各种重新裁剪的图像来扩充训练数据，试图强制模型泛化，但这并不能解决参数过多的问题。

3.

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。