深度学习进行目标定位和识别
文章平均质量分 96
在这个专栏中,我们以RCNN作为首先第一篇,然后讲解spp net,Fast RCNN,以及Faster RCNN,还有YOLO等等网络结构,按它的提出顺序(因为后面提出的网络往往是针对前面网络的问题而提出的)进行讲解,希望可以对你有用!
阿华Go
做一个有责任心有上进心的汉子,我要肩负起守护家人的重任!!!
展开
-
YOLO初探
YOLO有S*S的格子,每个格子包含B个边界框,格子对应的预测总的类别数为C种类别。总结重点:1、一张图片中有多个object,即一张图片中有多个对象,如下图所示,我们框了很多的真实框,那么S*S*B个bbox的对应的confidence怎么计算出来呢?confidence=p(object)*IOU(truth,pred),那么p(object)和IOU(truth,pred)怎么求...原创 2018-03-09 11:28:02 · 3400 阅读 · 3 评论 -
SPP-net解读
介绍:在上面的过程中我们已经看了YOLO实现图片的定位和识别的过程,可以看到它是一个end-to-end的网络,通过设置S*S个格子,然后让每个格子预测B个bbox,然后进行NMS可以得到置信度较大的几个类的预测,然后进行回归分析,注意里面loss值的计算,便可以得到计算速度非常快,效果很不错的YOLO网络,相比faster-rcnn网络,效果没有那么好,但是速度却有了很大的提升!今天我们看一个非...原创 2018-03-20 16:57:10 · 5139 阅读 · 4 评论 -
RCNN探秘
文章结构:主要的步骤1)输入原图—> 2)候选区域生成—> 3)对候选区域进行截取或者放缩变换,统一到统一大小—> 4)对每个候选区域利用CNN进行特征提取—> 5)特征送入每一类SVM分类器中进行判别—> 6)bounding box回归得到候选框位置。1)候选区域生成: 候选区域我们一般采用Selective Search方法,每张...原创 2018-03-18 20:15:57 · 719 阅读 · 0 评论