MEGA Reading
基本步骤
假设视频一共有Z帧,T<Z,按照1到T的顺序随机选出一些帧贴上标签,那么该视频就会生成一个S={1,…,T}的索引序列。
边界框由位置特征「空间信息:高,宽,中心位置的x坐标和y坐标,时间信息:帧号」和语义特征组成,候选边界框Bt通过RPN在每一帧图片上生成,第t帧图片生成Bt={bti}i为第t帧图片上的第i个候选边界框。
局部池由检测帧前后n个相邻帧中的所有候选边界框组成。全局池由从S中连续选出的Tg个标签所对应的帧生成的候选边界框组成,从第g个标签开始选,g<或者=T。S为打乱
原创
2020-11-28 14:21:37 ·
194 阅读 ·
0 评论