50、深度计算机视觉中的目标检测、跟踪与分割技术

五行擒拿术

于 2025-09-03 10:03:52 发布

阅读量28

点赞数

CC 4.0 BY-SA版权

分类专栏：动手学AI：从零到精通文章标签：目标检测全卷积网络 FCN

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/table/article/details/152288639

动手学AI：从零到精通专栏收录该内容

77 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

深度计算机视觉中的目标检测、跟踪与分割技术

1. 目标检测基础与全卷积网络

传统的目标检测方法虽然效果不错，但需要多次运行卷积神经网络（CNN），速度较慢。例如，简单的目标检测方法在某些示例中需要运行 CNN 15 次。不过，有一种更快的方法，即使用全卷积网络（FCN）。

FCN 的概念最早是为语义分割任务提出的，其核心思想是将 CNN 顶部的全连接层替换为卷积层。下面通过一个例子来理解：假设有一个全连接层，它有 200 个神经元，位于一个输出 100 个 7×7 特征图的卷积层之上。每个神经元会计算卷积层所有 100×7×7 激活值的加权和（再加上一个偏置项）。

若将这个全连接层替换为一个使用 200 个 7×7 滤波器、采用“valid”填充的卷积层，该卷积层将输出 200 个 1×1 的特征图，即输出 200 个数字，这与全连接层的输出数量相同。而且，仔细观察卷积层的计算过程，会发现这些数字与全连接层产生的数字完全相同。唯一的区别在于，全连接层的输出是形状为 [批量大小, 200] 的张量，而卷积层的输出是形状为 [批量大小, 1, 1, 200] 的张量。

将全连接层转换为卷积层时，需要满足以下条件：
- 卷积层的滤波器数量必须等于全连接层的单元数量。
- 滤波器大小必须等于输入特征图的大小。
- 必须使用“valid”填充。步长可以设置为 1 或更大。

全连接层需要特定的输入大小，而卷积层可以处理任意大小的图像（不过，它要求输入具有特定数量的通道）。由于 FCN 只包含卷积层和池化层（池化层也有类似特性），因此它可以在任意大小的图像上进行训练和执行。

例如，一个用于花卉分类和定位的

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。