ICASSP 2022 | 前沿音视频成果分享：基于可变形卷积的压缩视频质量增强网络

原创

于 2022-03-11 14:10:26 发布 · 4.6k 阅读

4 ·

CC 4.0 BY-SA版权

文章标签：

#音视频 #网络 #人工智能

阿里云视频云视频编码与增强技术团队最新研究成果论文《基于可变形卷积的压缩视频质量增强网络》（Deformable Convolution Dense Network for Compressed Video Quality Enhancement）已被 ICASSP 2022 Image, Video & Multidimensional Signal Processing 主题会议接收，并受邀在今年5月的全球会议上向工业界和学术界进行方案报告。以下为技术成果的核心内容分享。

佳芙｜作者

背景

视频压缩算法是一种广泛应用于视频传播和视频存储的技术，它能够帮助节省带宽和节约存储空间，但同时也带来了视频质量下降的问题。压缩视频质量增强任务的目标便是减少由视频压缩带来的 artifacts，提升视频质量。

近些年来，基于多帧策略的方法成为了压缩视频质量增强任务中的主流，为了融合多帧信息，这些方法大多都严重依赖于光流估计，然而不准确且低效率的光流估计算法限制住了增强算法的性能。为了打破光流估计算法的限制，本文提出了一种结合了可变形卷积的稠密残差连接网络结构，这个网络结构无需在显式光流估计的帮助下就能完成从高质量帧到低质量帧的补偿。

利用可变形卷积来实现隐式的运动估计，并通过稠密残差连接来提高模型对误差的容忍度。具体而言，我们所提出的网络结构由两个模块组成，分别是利用可变形卷积来实现隐式估计的运动补偿模块，以及使用稠密残差连接来提高模型误差容忍度和信息保留度的质量增强模块，此外，本文还提出了一个新的边缘增强损失来增强物体边缘结构。在公开数据集上的实验结果表明，该方法显著优于其他 baseline 模型。