image-text matching(六)Visual Semantic Reasoning for Image-Text Matching
最新推荐文章于 2024-11-04 22:06:21 发布
该论文提出了一种名为VSRN的模型,用于解决图文匹配任务中的挑战。通过区域关系推理和全局语义推理,VSRN能够生成增强的视觉特征表示,从而更好地匹配文本。实验结果显示,该模型在MS-COCO和Flickr30K数据集上的性能超越了现有最佳方法。


最低0.47元/天 解锁文章
1987

被折叠的 条评论
为什么被折叠?



