Scale-space flow for end-to-end optimized video compression 个人理解

最新推荐文章于 2024-12-26 12:24:19 发布

原创

最新推荐文章于 2024-12-26 12:24:19 发布 · 2.5k 阅读

·

3

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#深度学习 #人工智能

本文提出一种基于尺度空间光流的全新端到端视频编解码框架，解决了传统方法中光流预测的孔径问题和复杂度问题，简化了训练流程，实验结果超过现有基于学习的视频编解码技术。

文献地址:http://openaccess.thecvf.com/CVPR2020_search.py

文章中了CVPR2020。

目录

二、本文贡献

三、论文思想

五、结论与总结

一、概述

本文提出了一套全新的端到端视频编解码框架。针对现有基于学习的视频编解码需要光流、双线性warping和运动补偿，而且有相对复杂的架构和训练策略(需要预训练光流、训练各个子网络、训练过程中重建帧需要缓冲区)，本文提出一种广义warping操作，可以处理比如去遮挡、快速运动等复杂问题，而且模型和训练流程大大简化。

二、本文贡献

本文对现有的基于学习的包含光流估计+运动补偿的框架总结出四个问题：

（1）光流预测需要解决孔径问题（光流之所以是个病态问题的原因），这个问题比压缩问题更复杂；

（2）编解码框架中加入光流网络，给整个编解码框架增加了约束和复杂度；

（3）好的光流模型如果想要达到state-of-the-art表现，需要标注数据且训练复杂化。根据DVC的训练过程，在联合训练整个网络时，不需要单独的光流标注数据，所以作者总结的这个现有基于学习的视频编解框架的缺点个人认为有点牵强。

（4）稠密光流没有“no use”的概念，每个像素都要进行warped，导致无遮挡情况下会有较大残差。

针对上面四个现有框架缺点，作者提出改进措施，本文的贡献如下：

（1）提出尺度空间光流和warping，一种对光流+双线性warping的直观概述；

（2）简单的编解码框架和训练过程。

（3）实验结果显示达超过了基于训练的视频编解码的state-of-the-art结果，而且消融实验也表明了方法的有效性。

三、论文思想

1、尺度空间光流

重点就在于构造光流时引入了scale field。

最低0.47元/天解锁文章

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。