HCP: A Flexible CNN Framework for Multi-label Image Classification论文学习
特点
1.训练集不需要默认正确的box标签
2.HCP结构可以过滤噪声或者不相关的假设box
3.共享cnn层可以预训练大型单标签数据集
4.可以输出多标签预测结果
## 整体思路
输入为一张完整的覆盖多个独立物体的图,根据BING或者EdgeBoxes方法生成拥有高计算效果和高物体检测召回率的boxs,为了减低共享cnn层的计算量,提出了HS方法去过滤boxs(HS方法:最小面积不得小于900,宽高比或高宽比不得大于4,将BING或EdgeBoxes得分最高的boxs,归一化成正方形后输入共享cnn)
训练:初始化处理HCP主要包含两个部分,1、ImageNet预训练初始化共享cnn层。2、更改后面全连接网络输出(1000改为多分类个数,ImageNet分1000类),增加多标签labels为全连接层输入,并且增加图像微调(I-FT)处理。初始化之后,进行最大池化(Max-pooling)猜想微调(H-FT)。
实验结果
项目资料:http://blog.youkuaiyun.com/mr_curry/article/details/54629129