《Fine-grained Video-Text Retrieval with Hierarchical Graph Reasoning》阅读及代码实现

论文阅读

论文阅读这部分我也是通过网上资料和有道翻译进行阅读的,这篇论文是中国人民大学博士生陈师哲今年发表在CVPR会议上的论文,网上资料并不是很多, 我也没有完全明白,就不说太多了。

Fine-grained Video-Text Retrieval with Hierarchical Graph Reasoning基于层次图推理模型的细粒度文本视频检索。细粒度是指比普通的检索更精细化一些,这里的HGR模型是作者提出的将视频文本匹配转换成全局到局部的层次模型。此模型将文本分解成包括事件、动作和实体的层次语义图,然后利用基于注意力机制的图推理生成层次文本嵌入矩阵,能更好的捕捉全局和局部信息。
在这里插入图片描述 Text-to-video retrieval examples (green: correct; red: incorrect)
Video-to-text retrieval examples
Text-to-video retrieval examples (green: correct; red: incorrect)
1.论文介绍:
(1)互联网上如YouTube和TikTok等视频的迅速出现,给视频内容的准确检索带来了巨大挑战。
(2)传统的基于关键字搜索的检索方法由于关键词是有限的和非结构化的,检索各种不同

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值