论文题目:Online Adaptation of Convolutional Neural
Networks for Video Object Segmentation
论文链接:https://arxiv.org/pdf/1706.09364.pdf
OnAVOS可以看作是在OSVOS上面进行的拓展。由于OSVOS并没有考虑时序因素,因此假如object的外观变化太大,那么对OSVOS来说就是一个不小的挑战。因此,这篇OnAVOS就是在OSVOS上面增加了两个extension,以解决large changes in object appearance的问题。
本文的贡献主要有如下两点(即两个extensions):
(1)采用了online adaptation来适应物体外观的变化;
(2)采用了一个更新的网络架构,并额外做了objectness的预训练。
OnAVOS包括四部分网络,分别是:Base Network,Objectness Network,Domain Specific Objectness Network,以及Test Network。除了Objectness Network,其他的都与OSVOS中的三个网络大同小异,下面分别进行简要介绍:
Base Network:在ImageNet这类大型数据集上做分类预训练,以学习到物体的representation。与OSVOS不同的是,OSVOS的backbone采用的是VGG模型,而OnAVOS采用了较宽的Resnet;
Objectness Network:这一部分是OnAVOS新增加的enxtensi