目标检测与生成对抗网络技术解析
1. R - CNN的局限性
R - CNN在目标检测方面表现良好,但也存在一些缺点:
- 提案数量过多 :R - CNN会生成大量的提案(每个图像约2000个),每个提案都要独立通过卷积神经网络,这使得网络运行速度非常慢。而且这些区域提案是由区域提案算法固定生成的,R - CNN本身并不会学习这些提案。
- 定位与分类模型分离 :定位和预测的边界框来自不同的模型,在模型训练过程中,无法基于训练数据学习到特定的目标定位信息。
- 处理成本高 :在分类任务中,卷积神经网络生成的特征用于微调支持向量机(SVM),导致处理成本较高。
2. Fast R - CNN和Faster R - CNN
2.1 Fast R - CNN
Fast R - CNN节省了R - CNN中多次卷积操作(每个图像每次选择性搜索约2000次)的大量成本。然而,它的区域提案仍然依赖于外部区域提案算法,如选择性搜索。这种对外部算法的依赖导致Fast R - CNN在计算区域提案时成为瓶颈,网络必须等待这些外部提案生成后才能继续处理。
2.2 Faster R - CNN
Faster R - CNN消除了这些瓶颈问题,它在网络内部生成区域提案,而不依赖外部算法。其架构图与Fast R - CNN相似,但新增了一个区域提案网络,消除了对外部区域提案方案(如选择性搜索)的依赖。
下面用表格总结R - CNN、Fast R - CNN和Faster R
超级会员免费看
订阅专栏 解锁全文
661

被折叠的 条评论
为什么被折叠?



