1.简介:
RLSD出自论文《Multi-label Image Classifification with Regional Latent Semantic Dependencies》中,即Regional Latent Semantic Dependencies。
RLSD可以看做是CNN+RPN(region proposal network)+LSTM. 用于多标签图片分类,即识别一张图片中的多个物体与类别。CNN采用的VGGNET。
所以RLSD在效果方面比CNN+RNN(LSTM)会好些,尤其是在小物体检测方面,因为其关注RPN上的标签依赖关系,而不是整个图片层的标签依赖关系。
另外,实验结果也比Multi-label CNN、HCP效果好。

2.模型结构


3.模型实验结果


RLSD是一种结合了CNN、RPN和LSTM的多标签图像分类算法,特别适用于小物体检测,通过关注区域提案网络上的标签依赖关系提高精度。实验表明,其性能优于Multi-label CNN、HCP等模型。
18万+

被折叠的 条评论
为什么被折叠?



