1. 目标检测
“目标检测”主要解决两个问题:图像上多个目标在哪里(位置),是什么(类别)
人们一般把其发展历程分为3个阶段:
a.传统的目标检测方法
b.两阶段检测器
以R-CNN为代表的结合region proposal和CNN分类的目标检测框架(R-CNN, SPP-NET, Fast R-CNN,Faster R-CNN, R-FCN)
c. 单阶段检测器
以YOLO为代表的将目标检测转换为回归问题的端到端(End-to-End)的目标检测框架(YOLO, SSD)
2. 常用数据集
Pascal VOC 2012、PascalVOC 2007、ILSVRC 2012
ILSVRC 2012样本集上仅有图像类别标签,没有图像物体位置标注;
PASCAL VOC 2007样本集上既有图像中物体类别标签,也有图像中物体位置标签;
3. 有监督预训练
也称之为迁移学习,举例说明:若有大量标注信息的人脸年龄分类的正负样本图片,利用样本训练了CNN网络用于人脸年龄识别;现在要通过人脸进行性别识别,那么就可以去掉已经训练好的人脸年龄识别网络CNN的最后一层或几层,换成所需要的分类层,前面层的网络参数直接使用为初始化参数,修改层的网络参数随机初始化,再利用人脸性别分类的正负样本图片进行训练,得到人脸性别识别网络,这种方法就叫做有监督预训练。
这种方式可以很好地解决小样本数据无法训练深层CNN网络的问题,我们都知道小样本数据训练很容易造成网络过拟合