目标检测基础知识

本文详细介绍了目标检测的基本概念、发展历程,包括传统方法、两阶段和单阶段检测器。探讨了常用数据集如Pascal VOC和ILSVRC,以及有监督预训练在解决小样本问题中的应用。此外,还讲解了Selective Search算法、感受野、模型评价指标如F1分数、ROC曲线和AP/mAP等关键概念,最后提到了非极大值抑制和边框回归在提升检测效果中的作用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1. 目标检测

  “目标检测”主要解决两个问题:图像上多个目标在哪里(位置),是什么(类别)

人们一般把其发展历程分为3个阶段: 

  a.传统的目标检测方法 

  b.两阶段检测器

  以R-CNN为代表的结合region proposal和CNN分类的目标检测框架(R-CNN, SPP-NET, Fast R-CNN,Faster R-CNN, R-FCN)

  c. 单阶段检测器

    以YOLO为代表的将目标检测转换为回归问题的端到端(End-to-End)的目标检测框架(YOLO, SSD)

2. 常用数据集

Pascal VOC 2012、PascalVOC 2007、ILSVRC 2012

ILSVRC 2012样本集上仅有图像类别标签,没有图像物体位置标注;

PASCAL VOC 2007样本集上既有图像中物体类别标签,也有图像中物体位置标签;

3. 有监督预训练

  也称之为迁移学习,举例说明:若有大量标注信息的人脸年龄分类的正负样本图片,利用样本训练了CNN网络用于人脸年龄识别;现在要通过人脸进行性别识别,那么就可以去掉已经训练好的人脸年龄识别网络CNN的最后一层或几层,换成所需要的分类层,前面层的网络参数直接使用为初始化参数,修改层的网络参数随机初始化,再利用人脸性别分类的正负样本图片进行训练,得到人脸性别识别网络,这种方法就叫做有监督预训练。

  这种方式可以很好地解决小样本数据无法训练深层CNN网络的问题,我们都知道小样本数据训练很容易造成网络过拟合

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值