最近在做RDOQ算法优化和硬件系统结构设计,建立其时序模型,估算算法的硬件复杂度。在做这部分工作的同时,博主学习了图像的二维变换与离散余弦变换(DCT),总结如下:
1. 图像的二维离散变换
与一维的有限长离散非周期信号存在傅里叶变换(DFT)一样,图像作为一个二维离散信号同样存在着二维离散变换(注意这里是介绍一个通用的概念,二维离散变换,包括了DFT、DCT等多种变换在内的一种通式写法),其通式可以表达为
1.1 二维变换的可分性与对称性
如果一个二维变换核同时具备可分性与对称性,此时允许用两个一维变换来计算二维变换,即首先沿着输入的行(列)进行一维变换,接着用第一步得到的结果再对列(行)进行一维变换。当变换对的正反变换都满足这个条件时,且 f(x,y)f(x,y) 是大小为 M×MM×M 的方形图像时,式(2.6-30)和式(2.6-31)可表示为矩阵形式
T=AFAT
其中 FF 矩阵是包含元素 f(x,y)f(x,y) 的 的M×M的M×M 矩阵,AA 矩阵是有元素 ai,j=r1(i,j)ai,j=r1(i,j) 的 M×MM×M 矩阵,TT 是 M×MM×M 变换的结果,其值为 T(u,v),u,v=0,1,…,M−1T(u,v),u,v=0,1,…,M−1,其中的 AA 矩阵并不是所说的基函数或者基图像,而由r(x,y,u,v)r(x,y,u,v) 构成的图像才是基图像。具体什么事基函数,如何获得基图像将在下面说明。
1.2 为什么二维变换可以用矩阵表示
首先回顾一下