二维DCT变换

离散余弦变换,尤其是它的第二种类型,经常被信号处理图像处理使用,用于对信号图像(包括静止图像运动图像)进行有损数据压缩。这是由于离散余弦变换具有很强的"能量集中"特性:大多数的自然信号(包括声音和图像)的能量都集中在离散余弦变换后的低频部分,而且当信号具有接近马尔可夫过程Markov processes)的统计特性时,离散余弦变换的去相关性接近于K-L变换Karhunen-Loève变换——它具有最优的去相关性)的性能。

例如,在静止图像编码标准JPEG中,在运动图像编码标准MJPEGMPEG的各个标准中都使用了离散余弦变换。在这些标准制中都使用了二维的第二种类型离散余弦变换,并将结果进行量化之后进行熵编码。这时对应第二种类型离散余弦变换中的n通常是8,并用该公式对每个8x8块的每行进行变换,然后每列进行变换。得到的是一个8x8的变换系数矩阵。其中(0,0)位置的元素就是直流分量,矩阵中的其他元素根据其位置表示不同频率的交流分量。

一个类似的变换, 改进的离散余弦变换被用在高级音频编码AAC for Advanced Audio Coding),Vorbis 和 MP3 音频压缩当中。

离散余弦变换也经常被用来使用谱方法来解偏微分方程,这时候离散余弦变换的不同的变量对应着数组两端不同的奇/偶边界条件。


DCT(Discrete Cosine Transform),又叫离散余弦变换,它的第二种类型,经常用于信号和图像数据的压缩。经过DCT变换后的数据能量非常集中,一般只有左上角的数值是非零的,也就是能量都集中在离散余弦变换后的直流和低频部分,下面我会用matlab来演示整个过程。

1.一维DCT变换

我们首先来看看一维的DCT变换,这是二维的基础。一维的DCT变换共有8种,其中最实用的是第二种形式,公式如下:

其中c(u)是加上去一个系数,为了能使DCT变换矩阵成为正交矩阵,在后面二维变换将看到他的作用。N是f(x)的总数。相比其他几种形式,他的运算还是比较简单的,因此也用的比较广。

2.二维DCT变换

二维DCT变换是在一维的基础上再进行一次DCT变换,这个比较好理解,直接看公式:

这里我只讨论两个N相等的情况,也就是数据是方阵的形式,在实际应用中对不是方阵的数据都是先补齐再进行变换的。为了matlab仿真方便点,写成矩阵形式:

下面就用matlab来模拟一下,使用随机生成的4×4矩阵作为输入,程序如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
clear;
clc;
X=round(rand(4)*100);%随机生成的数据
A=zeros(4);%变换矩阵
for i=0:3
     for j=0:3
         if i==0
             a=sqrt(1/4);
         else
             a=sqrt(2/4);
         end           
         A(i+1,j+1)=a*cos(pi*(j+0.5)*i/4);
     end
end
Y=A*X*A';%DCT变换
YY=dct2(X);%用matlab中的函数进行DCT变换

Y是使用上面的公式进行变换,YY是用matlab自带的dct2函数变换,结果是是:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
X =
     61    19    50    20
     82    26    61    45
     89    90    82    43
     93    59    53    97
     
Y =
   242.5000   32.1613   22.5000   33.2212
   -61.8263    7.9246  -10.7344   30.6881
   -16.5000  -14.7549   22.5000   -6.8770
     8.8322   16.6881  -35.0610   -6.9246
     
YY =
   242.5000   32.1613   22.5000   33.2212
   -61.8263    7.9246  -10.7344   30.6881
   -16.5000  -14.7549   22.5000   -6.8770
     8.8322   16.6881  -35.0610   -6.9246

可以看出Y和YY的结果是一样的,这也进一步验证了上面的公式是正确的。由于X是我随机生成的,相关性很小,变换后的结果比较乱;如果是信号或图像这样相关性比较大的数据的话,数值会集中在左上角,右下角一般都是零,再使用“之”字型扫描得到数据流会包含很多连续的零,编码后数据量会非常小,这就是DCT变换带来的好处。

3.二维DCT反变换

DCT逆变换的公式如下:

矩阵形式可以由正变换的公式直接推出来,因为在A中加了c(i)这个系数,使得A成为了正交矩阵,所以我们就可以这样做:

在用matlab来验证是否能反变换出原来的数据:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
clear;
clc;
X=[
     61    19    50    20
     82    26    61    45
     89    90    82    43
     93    59    53    97];
A=zeros(4);
for i=0:3
     for j=0:3
         if i==0
             a=sqrt(1/4);
         else
             a=sqrt(2/4);
         end           
         A(i+1,j+1)=a*cos(pi*(j+0.5)*i/4);
     end
end
Y=A*X*A';
X1=A'*Y*A;

X使用的是上面正变换用的数据,运行后得到的X1为:

1
2
3
4
5
X1 =
    61.0000   19.0000   50.0000   20.0000
    82.0000   26.0000   61.0000   45.0000
    89.0000   90.0000   82.0000   43.0000
    93.0000   59.0000   53.0000   97.0000

和X完全相等。在实际进行编码的时候,比如JPEG压缩的时候,只会对Y左上角的数据进行传输,所以解码出来的内容不会完全和原来的相同。

4.整数DCT变换

说道DCT就顺便提一下x264中的整数DCT变换,整数DCT变换是以DCT变换为基础的,为了减少计算量做的一些调整,下面我写一下整数DCT变换公式的大致推导过程:

然后根据A是正交矩阵,把c=bd带入A中,使行向量为单位向量可以得到d=0.4142。令d=0.5,得到b*b=0.4,代入上面的式子中,把0.5提取出来放到右边的点乘中就得到了:

这样在对大括号部分进行计算时就都是加法和减法了,而且在精度上没有太大降低。在x264实际编码中,变换和量化是一起进行的,使得编码速度有了很大的提高。


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值