拖了很久采写
1.Fast-RCNN总结:
参考论文https://blog.youkuaiyun.com/shenxiaolu1984/article/details/51036677
https://www.jianshu.com/p/fbbb21e1e390
参考代码:https://github.com/Liu-Yicheng/Fast-RCNN
1.根据SPP-NET中空间金字塔的原理,采用ROI pooling 方法,空间金字塔是3个不同大小的卷积核池化后相加,ROI pooling是一个卷积核池化。
2.ROI pooling得到的特征图连接fc层时采用SVD,减少数据运算
3.不再采用SVM分类,使用Softmax的方式分类,把分类和bbox放在一起训练,提出了multi-task loss,整合两个损失函数。
4.image-centric sampling,同一图像的候选区域卷积共享计算和内存,降低了运算开销。
说白了就是规定进入网络的2个图像,每个图像取64个ROI,64个ROI可以复用这张图片前5个阶段的网络特征。
就是64个ROI的前5个的卷积核参数一样。(这里不太理解)
1.trian
2.test
代码太少,而且太过古老,使用caffe ,暂时不再去尝试。