论文阅读
论文阅读这部分我也是通过网上资料和有道翻译进行阅读的,这篇论文是中国人民大学博士生陈师哲今年发表在CVPR会议上的论文,网上资料并不是很多, 我也没有完全明白,就不说太多了。
Fine-grained Video-Text Retrieval with Hierarchical Graph Reasoning基于层次图推理模型的细粒度文本视频检索。细粒度是指比普通的检索更精细化一些,这里的HGR模型是作者提出的将视频文本匹配转换成全局到局部的层次模型。此模型将文本分解成包括事件、动作和实体的层次语义图,然后利用基于注意力机制的图推理生成层次文本嵌入矩阵,能更好的捕捉全局和局部信息。
Text-to-video retrieval examples (green: correct; red: incorrect)
Text-to-video retrieval examples (green: correct; red: incorrect)
1.论文介绍:
(1)互联网上如YouTube和TikTok等视频的迅速出现,给视频内容的准确检索带来了巨大挑战。
(2)传统的基于关键字搜索的检索方法由于关键词是有限的和非结构化的,检索各种不同