视频文本检索论文笔记(二):Dual Encoding for Video Retrieval by Text
最新推荐文章于 2024-10-10 08:08:20 发布
本文介绍了一种2019 CVPR后改进的视频检索方法,通过双编码技术结合多级视频和文本特征,包括全局、时间层次和局部增强编码。文章详细阐述了混合空间学习,包括潜在空间和概念空间的训练策略,以及如何计算视频-文本相似度。


最低0.47元/天 解锁文章
1175





