论文笔记 之Clockwork Convnets for Video Semantic Segmentation

ClockworkConvNets视频语义分割
针对视频语义分割计算量大的问题,本文提出ClockworkConvNets模型,利用深层特征变化缓慢的特性,结合自适应时钟机制,减少重复计算,实现高效视频语义分割。

1,本文解决的问题

应用于单帧的语义分割直接应用于视频时,计算量太大。即如何降低视频语义分割的整体计算量和延迟?

2,本文的方法

通过研究视频各帧在时间上的关联,减少计算量。

1,作者的两个观察

1,深层特征变化比浅层特征慢

图像的像素变化很大,但是场景的语义信息变化很小(深层特征变化比浅层特征慢)

作者设计了一个实验来证明和探究这种现象:
将两帧时间戳t,t-1相近图像输入卷积神经网络(好像是FCN),将其在某个layer输出的特征图St和St-1(尺度:WxHx深度)输入到一个打分层l(score layer)。
l是一个线性层,其预测St和St-1的每一个像素是K个类别的概率,l的输出是Stl和St-1l(尺度:WxHxK)。
将Stl和St-1l改为one-hot-encoding形式,即将概率最大的类别设为1,其余为0。
使用hamming distance(值不同的位的数量) 计算Stl和St-1l的one-hot-encoding形式的difference:dsm
在这里插入图片描述
作者计算了不同layer的dsm,结果见表Table1和图Fig2:

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值