51、实用音频/图像/视频的现代变换设计与多尺度变换概述

最新推荐文章于 2025-11-21 03:00:22 发布

白露未晞593

最新推荐文章于 2025-11-21 03:00:22 发布

阅读量19

点赞数

CC 4.0 BY-SA版权

分类专栏：信号与机器学习融合之道文章标签：音频处理图像处理视频处理

本文链接：https://blog.youkuaiyun.com/bash7scripter/article/details/152402291

信号与机器学习融合之道专栏收录该内容

100 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

实用音频/图像/视频的现代变换设计与多尺度变换概述

1. 高阶设计方法

在音频、图像和视频处理中，为了实现更高效的信号处理和压缩，需要不断优化变换设计。高阶设计方法主要包括以下几种：
- HD 照片或 JPEG - XR 变换 ：JPEG - XR 是一种静态图像压缩算法和文件格式，于 2010 年被批准为国际标准。它的变换阶段包括照片核心变换（PCT）和照片重叠变换（POT），这两个算子由硬件友好的二进有理提升步骤级联构成。例如，PCT 中的两个二进提升步骤的选择来自特定配置。在实际实现中，使用二进有理提升步骤来近似无理缩放，使得整个变换阶段仅由二进有理提升步骤级联而成。
- 自适应分解设计 ：自适应意味着编码器或解码器可以根据输入的局部统计行为动态选择时变的自适应算子。如果能巧妙避免或最小化边信息的使用，自适应可以显著提高编码效率。具体有以下几种方式：
- 自适应预处理/后处理支持 ：在预处理/后处理框架内，可根据变换系数的能量决定是否开启预处理/后处理，还能动态改变预处理支持的大小。例如，固定块大小为 M = 4 时，预处理算子可在无处理、2×2 处理或 4×4 处理中选择。通过这种方式，从 4×8 到 4×4 进行线性映射的切换。当变换设置为固定块大小的 DCT（如 8），且预处理/后处理算子大小从集合 {0, 2, 4, 8} 中选择时，每个块边界的边信息仅需 2 位，还可通过 Huffman 或基于上下文的自适应算术编码进一步降低边信息。
- 自适应变换块大小 ：采用可变块大小的分解方案。在信号缓慢变化的均匀部分，使用

会员秒杀 ¥9.9 重磅福利

超级会员免费看