Lloyd-Max | 迭代优化 / 条件推导

注:本文为 “Lloyd-Max” 相关合辑。
略作重排,如有内容异常,请看原文。


Lloyd-Max 迭代

posted @ 2015-06-22 22:31 Loyal_1884
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述


数据压缩补充知识——量化器(Lloyd-Max 条件推导)

Adore11 已于 2022-07-13 00:34:56 修改

一、基础知识

Lloyd-Max 标量量化器(非均匀量化器):又称概率密度函数(Probability Density Function, PDF)最优量化器。

img

量化设计需考虑的核心要点如下:

img

Lloyd-Max 量化器的核心设计准则为:在信源符号概率密度函数 ( f_X(x) ) 取值较大的区域,减小量化区间宽度;在 ( f_X(x) ) 取值较小的区域,增大量化区间宽度。其本质是对出现概率高的信源符号采用“细量化”(小区间),对出现概率低的信源符号采用“粗量化”(大区间),以实现量化失真的最小化。

基于上述准则,可引出 Lloyd-Max 量化器的两个核心结论:

img

  • 量化判决门限应取于相邻两个量化重建电平的中点
  • 量化重建电平应取于对应量化区间的质心。

下文将对上述两个核心结论进行数学推导。

二、条件推导

为清晰呈现推导过程与逻辑关系,采用手写推导形式,具体如下:

img

三、重要结论

  1. 对于服从均匀分布的信源信号,采用均匀量化器可实现最优量化性能(即最小化量化失真)。
  2. 对于服从非均匀分布的信源信号,采用 Lloyd-Max 量化器可实现最优量化性能;当输入信号退化为均匀分布时,Lloyd-Max 量化器与均匀量化器的性能完全一致(即 Lloyd-Max 量化器是均匀量化器的广义推广)。

尽管 Lloyd-Max 量化器可针对非均匀分布信号实现最小量化失真(其“概率高区域细量化、概率低区域粗量化”的特性,使量化失真显著优于均匀量化),但在实际数据压缩系统中,还需结合后续熵编码环节的需求综合考量——量化后的输出需输入熵编码器(如 Huffman 编码器、算术编码器等),最终生成压缩码流。

熵编码的核心优化目标是“最小化平均码长”,其实现依赖于输入符号的概率分布特性:对于概率分布非均匀的输入符号集,熵编码器可对高概率符号分配短码长、对低概率符号分配长码长,从而显著降低平均码长,提升压缩效率;反之,若输入符号概率分布均匀,则熵编码难以实现有效压缩。

为进一步验证上述特性,回顾非均匀量化与均匀量化的输出概率分布差异:

1. 非均匀量化输出的概率分布

非均匀量化(以 Lloyd-Max 量化器为例)的输出符号概率分布如图所示:

img

图中编号为 1、2、3、4 的量化区间,其对应输出符号的出现概率(可通过各区间的面积近似表征,即概率密度函数在区间内的积分)近乎相等,即输出符号服从均匀分布

2. 均匀量化输出的概率分布

均匀量化的输出符号概率分布如图所示:

img

图中编号为 3、4、5、6、7、8 的量化区间,其对应输出符号的出现概率存在显著差异(高概率密度区域的区间对应高输出概率,低概率密度区域的区间对应低输出概率),即输出符号服从非均匀分布

最终结论

综合量化失真与熵编码效率的权衡,可得到如下核心结论:

  • 非均匀量化:输出符号服从均匀分布 → 熵编码难以实现有效压缩(不适合熵编码);
  • 均匀量化:输出符号服从非均匀分布 → 熵编码可通过“长短码分配”降低平均码长(适合熵编码)。

因此,在实际数据压缩系统中,直接采用均匀量化器是兼顾量化失真与压缩效率的优选方案。


【数据压缩】Lloyd-Max 标量量化器

蓼茸蒿笋 已于 2022-04-21 19:09:13 修改

一、问题引入

  • 均匀量化器仅对均匀分布信源具有最优性(即最小化均方误差)。其中,均匀分布信源的概率密度函数(Probability Density Function, PDF)满足 f ( x ) = 1 b − a f(x) = \frac{1}{b-a} f(x)=ba1 x ∈ [ a , b ] x \in [a,b] x[a,b] a a a b b b 分别为信源取值的上下界),此时均匀量化的区间划分可使均方误差最小;若信源非均匀分布,均匀量化器的性能会显著下降。

  • 对于给定的量化级数 M M M,为降低均方误差(Mean Square Error, MSE),需依据信源 PDF 调整量化区间:在信源概率密度 f ( x ) f(x) f(x) 较大的区域缩小量化区间(提高量化精度),在 f ( x ) f(x) f(x) 较小的区域增大量化区间(降低冗余)。

在这里插入图片描述

二、推导过程

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

三、推导结论

  • 结论 1(重建电平优化):量化电平(即重建电平) x ^ i \hat{x}_i x^i 应取为对应量化区间的质心,确保该区间内的失真积分最小。
  • 结论 2(决策边界优化):判决电平(即量化区间边界) t i t_i ti 应取为相邻两个重建电平的中点,使边界两侧的失真贡献均衡。


via:

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值