
视频编解码
cs_software_
孜孜求索浩如烟海的计算机视觉算法.
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
LEARNED VIDEO CODEC WITH ENRICHED RECONSTRUCTION FOR CLIC P-FRAME CODING个人理解
文章地址:https://arxiv.org/abs/2012.07462写在前面:本文提出了一个新的基于深度学习的端到端视频编解码框架,与DVC的框架有点相似,但也有几点区别。另外,网络和实验一些关键细节写的很详实。目录一、概述二、论文方法三、实验四、总结一、概述1、本文提出了一种基于学习的P帧编解码框架,对比实验是在CLIC2020 P帧压缩竞赛数据集上进行。2、和DVC一些不同点:(1)基于PWC net改进了运动估计;(2)残差编码基于Balle的框架进行原创 2020-12-30 10:23:41 · 768 阅读 · 0 评论 -
端到端图像、视频编解码研究者的福音
文章地址:https://arxiv.org/pdf/2011.03029.pdfgithub地址:https://github.com/InterDigitalInc/CompressAI/InterDigital AI Lab做了一个叫做CompressAI的研究平台,基于Pytorch,这是一个提供自定义操作、层、模型和工具以研究、开发和评估端到端图像和视频压缩编解码器的平台,可以降低基于深度学习的图片、视频压缩的入门门槛,方便研究人员。CompressAI有以下几个特点:1、构建端到原创 2020-11-06 13:19:56 · 918 阅读 · 2 评论 -
Learning to Compress Videos without Computing Motion 个人理解
文献地址:https://arxiv.org/pdf/2009.14110.pdf目录一、概述二、文章贡献三、论文思想四、实验五、结论与总结一、概述同样是端到端的利用深度学习来解决视频编解码问题,提供了一个新的思路:不进行运动估计的情况下进行图片压缩。二、文章贡献1、无论输入视频帧的尺寸或所需的压缩率如何,我们框架的所有元素都仅从端到端进行了一次训练;2、创新性地利用位移差异来捕捉运动,避免了运动估计和运动压缩的计算开销;3、组合LTSM-UNet有效地捕获了原创 2020-10-29 11:06:07 · 488 阅读 · 2 评论 -
DVC的Tensorflow实现来了
文献:OpenDVC:An Open Source Implementation of the DVC Video Compression Method文献地址:https://arxiv.org/abs/2006.15862code地址:https://github.com/RenYang-home/OpenDVC又是杨韧的一篇文章,他们已经在知乎(https://zhuanlan.zhihu.com/p/151807493?from_voters_page=true)上有所介绍,对于想研究基原创 2020-07-05 15:48:54 · 1153 阅读 · 2 评论 -
Learning for Video Compression with Hierarchical Quality and Recurrent Enhancement 个人理解
CVPR2020又一篇基于深度学习的端到端视频编解码框架。论文链接 https://arxiv.org/abs/2003.01966课题主页 https://github.com/RenYang-home/HLVC个人主页 https://renyang-home.github.io/知乎上已经有人进行解读:https://zhuanlan.zhihu.com/p/120518754。本文的框架虽然是新的,但是从实验结果看,依然只是比H265(x265,Low-Delay P very fa原创 2020-06-21 16:56:04 · 1584 阅读 · 2 评论 -
Scale-space flow for end-to-end optimized video compression 个人理解
文献地址:http://openaccess.thecvf.com/CVPR2020_search.py文章中了CVPR2020。一、概述本文提出了一套全新的端到端视频编解码框架。针对现有基于学习的视频编解码需要光流、双线性warping和运动补偿,而且有相对复杂的架构和训练策略(需要预训练光流、训练各个子网络、重建当前帧需要依赖预存的前一帧),本文提出一种广义warping操作,可以处理比如去遮挡、快速运动等复杂问题,而且模型和训练流程大大简化。二、本文贡献本文对现有的基于学习的包含光原创 2020-06-14 16:50:36 · 2453 阅读 · 3 评论 -
M-LVC: Multiple Frames Prediction for Learned Video Compression 个人理解
文献地址:https://arxiv.org/abs/2004.10290代码地址:https://github.com/JianpingLin/M-LVC_CVPR2020文章入选CVPR2020,网络上已经有对本文进行了简单解读(https://blog.youkuaiyun.com/moxibingdao/article/details/105804082,https://zhuanlan.zhihu.com/p/136343529),本文是对DVC的改进,因为在实际工作中,我们对DVC也进行了深入了解并原创 2020-05-31 19:45:02 · 1701 阅读 · 15 评论 -
Content Adaptive and Error Propagation Aware Deep Video Compression 个人理解
文献地址:https://arxiv.org/abs/2003.11282。一、概述该文章基于深度学习的端到端视频编解码框框架DVC(https://blog.youkuaiyun.com/cs_softwore/article/details/87006743)的后续研究,主要为了解决基于学习的视频编解码的错误传播和视频内容自适应问题问题。错误传播的问题通过在训练阶段考虑连续多帧的压缩来解决,是一个训练策略的改进;本文提出的内容自适应方案,可以根据视频内容在线更新编码器,区别于传统的手工编码模式。二、原创 2020-05-24 18:18:33 · 1205 阅读 · 0 评论 -
Learning Image and Video Compression through Spatial-Temporal Energy Compaction 个人理解
文章发表在CVPR2019,文章地址:http://openaccess.thecvf.com/content_CVPR_2019/papers/Cheng_Learning_Image_and_Video_Compression_Through_Spatial-Temporal_Energy_Compaction_CVPR_2019_paper.pdf一、摘要本文最核心的思想就是在图片和...原创 2019-12-24 16:22:46 · 795 阅读 · 0 评论