compressai的高斯建模GaussianCondition模块

超先验网络在图像压缩中的应用与熵编码

最新推荐文章于 2024-05-12 23:46:48 发布

原创

最新推荐文章于 2024-05-12 23:46:48 发布 · 1.7k 阅读

·

4

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#python #深度学习 #pytorch #人工智能

文章介绍了超先验网络如何改进图像压缩方法，通过为每个像素点的潜在表示建模来优化压缩效果。利用高斯分布和熵编码，减少了潜在表示的统计依赖关系，提高了压缩效率。误差函数和信息量的概念被用来计算比特率和损失函数，从而在压缩和保真度之间找到平衡。

超先验网络输出的 $σ\sigma$ 和 $μ\mu$ ，通过这两个参数对潜在表示y中的每一点都进行高斯建模，然后计算出每个像素值的概率，进行熵编码得到bit流。

理论

1、加入超先验网络的动机

以往的图像压缩都是对潜在表示整体进行熵建模，如假定整个潜在分布都服从同一分布，然而，当潜在表示存在统计依赖关系，这种全分解的熵模型并不能达到最优的压缩效果；
如果为潜在表示下的每个像素点分别估计各自的分布（均值和方差），在熵编码阶段中依据该信息，可以有效的消除原潜在表示中存在的边信息(Variational Image Compression with a Scale Hyperprior论文中的实验已经验证潜在分布y除以其方差确实可以减少相关性)

2、信息量及损失函数中bpp

信息量：表示该符号所需要的位数。

考虑用 0 和 1 组成的二进制数码为含有 n 个符号的某条消息编码，假设符号 $a_j$ 在整条消息中重复出现的概率为 $P_j$ ，则该符号的信息量定义为：
$E_n=-log_2(P_j)$
信息量表示为以 2 为底的对数，是正值。

举例说明:

输入信源字符串：aabbaccbaa

a、b、c 出现的概率分别为 0.5、0.3 和 0.2，他们的信息量分别为：
$E_a=-log_20.5=1\\ E_b=-log_20.3=1.737\\ E_c=-log_20.2=2.322$

最低0.47元/天解锁文章

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。