现代音频/图像/视频变换设计
1 背景和基础
1.1 符号说明
为了便于后续的讨论,先明确一些常用的符号:
- 设 $R$、$Q$ 和 $Z$ 分别表示实数集、有理数集和整数集。$D$ 表示二进有理数集,即所有可以表示为 $\frac{k}{2^m}$(其中 $k, m \in Z$)形式的有理数。
- 粗体小写字符表示向量,粗体大写字符表示矩阵。对于矩阵 $A$,$A^T$、$A^{-1}$、$|A|$ 和 $a_{ij}$ 分别表示其转置、逆、行列式和第 $i$ 行第 $j$ 列的元素。
- 一些特殊矩阵有保留符号:分析滤波器组的多相矩阵为 $E(z)$,综合滤波器组的多相矩阵为 $R(z)$,单位矩阵为 $I$,反转或反对角矩阵为 $J$,零矩阵(或向量)为 $0$,全 1 向量为 $1$,置换矩阵为 $P$,对角矩阵为 $D$。
- 字母 $M$ 通常表示滤波器组的通道数或变换的大小。
- $N$ 点向量 $x$ 的 $\ell_p$ 范数定义为 $|x| p = (\sum {i = 0}^{N - 1} |x_i|^p)^{\frac{1}{p}}$,其中 $\ell_2$ 范数 $|x|_2 = \sqrt{x^T x}$ 尤为重要。
1.2 变换基础
变换通常被视为一种线性映射,可以通过简单的矩阵乘法来实现。大小为 $M$ 的块变换 $T_A$ 是一个 $M \times M$ 的标量矩阵,它将信号向量 $x$ 映射到其对应的变换系数 $c$。这里下标 $A$ 表示分析变换,常用于编码器中对输入数据样本进行分析或去相关。在解码器中,需要逆算子 $T_S$ 来恢复 $x$,下标 $S
超级会员免费看
订阅专栏 解锁全文

1383

被折叠的 条评论
为什么被折叠?



