吴恩达深度学习笔记(四)week3目标检测

本文介绍了目标检测的基础概念,包括目标分类、目标定位及目标检测之间的区别,并深入探讨了特征点检测的方法及其应用场景,同时讲解了基于滑动窗口的目标检测原理以及如何通过卷积层提高检测效率。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

目标定位

目标分类、目标定位、目标检测的区别 ,目标分类与目标定位处理的图像只有一个目标,而目标检测有多个目标,目标分类输出只有一个,目标定位输出包括(目标是否存在,目标的坐标以及大小),目标检测需要把图片中的目标都检测出来。
这里写图片描述
关于目标定位的输出可以如下方式设置
这里写图片描述

特征点检测

当我们希望神经网络的输出能告诉我们图片中被检测对象的一些特征时,我们可以通过增加特征点作为神经网络的输出,如下图中识别图片人的表情 和人的动作。
这里写图片描述

基于滑动窗口的目标检测

滑动窗口目标检测的原理很简单,如下图所示。用一个窗口遍历整张图片,之后每次遍历都可以增大窗口的大小。
这里写图片描述

卷积的滑动窗口实现

用卷积层代替全连接层

这里写图片描述

卷积的滑动窗口实现

这里写图片描述
以上图中间图片为例子,若输入图片大小为16×16×316×16×3滑动窗口的大小为14×14×314×14×3,若使用全连接,则需要进行四次计算,但是,可以看到,中间许多计算是重复的,使用卷积层代替全连接层后则只需一次计算,如图所示,输出单元的左上角即为第一个滑窗的输出…右下角单元即为最后一个滑窗。对于下面图片28×28×328×28×3也是一个道理,64个输出单元对应64个滑窗的输出。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值