这是CVPR2018的一篇关于efficient video segmentation的文章,paper链接https://arxiv.org/abs/1802.01218,作者的homepage https://sites.google.com/site/linjieyang89/,tensorflow的code已经被released出来了https://github.com/linjieyangsc/video_seg。
文章要做的事情:
输入:annotated first frame+video 输出:video mask
文章中show出来的与其他方法做对比的exmaple如下所示。
在 DAVIS 2016和YoutubeObjects datasets上面与state-of-the-art对比的实验结果如下所示。
在DAVIS 2017 dataset上面与state-of-the-art对比的实验结果如下所示。

method
paper的framework如下所示。
framework主要分为下面的三部分:
- fully-convolutional main segmentation network。
- visual modulator network。
- spatial modulator network。
本文介绍了一种高效视频分割方法,该方法通过注释首帧与视频输入生成视频掩膜。研究已在DAVIS2016、YouTube Objects及DAVIS2017数据集上进行了验证。论文提出三个关键组件:全卷积主分割网络、视觉调制网络和空间调制网络。
1460

被折叠的 条评论
为什么被折叠?



