JPEG解码

最新推荐文章于 2022-07-13 12:28:44 发布

Tinsley's key

最新推荐文章于 2022-07-13 12:28:44 发布

阅读量2.3k

点赞数 2

分类专栏：笔记

本文链接：https://blog.youkuaiyun.com/weixin_43165881/article/details/106450588

版权

JPEG解码

JPEG（ Joint Photographic Experts Group）即联合图像专家组，是用于连续色调静态图像压缩的一种标准，文件后缀名为jpg或jpeg，是最常用的图像文件格式。其主要是采用预测编码（DPCM）、离散余弦变换（DCT）以及熵编码的联合编码方式，以去除冗余的图像和彩色数据，属于有损压缩格式，它能够将图像压缩在很小的储存空间，一定程度上会造成图像数据的损伤。尤其是使用过高的压缩比例，将使最终解压缩后恢复的图像质量降低，如果追求高品质图像，则不宜采用过高的压缩比例。

一、JPEG编码原理

编码过程如下图所示，解码是编码的逆过程。

下面简要说明编解码原理：

1、零偏置（Level Offset）

对于灰度级是2的n次方的像素，通过减去2^n-1次方，将无符号的整数值变成有符号数。例如：对于n=8，即：将0~255的值域，通过减去128，转换为值域在-128~127之间的值。这样做的目的是：使像素的绝对值出现3位10进制的概率大大减少。

2、DCT变换

对每个单独的彩色图像分量，把整个分量图像分成8×8的图像块，如图所示，并作为两维离散余弦变换DCT的输入

经过DCT变化后，图像中的低频分量会集中在左上角，由于图像低频能量高，所以左上角的数值大，右下角处的零值较多。
DCT变化可以做到以下三点：1、能量守恒 2、能量集中 3、去相关

3、量化

量化步距是按照系数所在的位置和颜色分量来确定的。因为人眼对亮度信号比对色差信号更敏感，因此使用了两种量化表：亮度量化值和色差量化值。
根据人眼的视觉特性（对低频敏感，对高频不太敏感）对低频分量采取较细的量化，对高频分量采取较粗的量化。
如果原始图象中细节丰富，则去掉的数据较多；反之，细节少的原始图象在压缩时去掉的数据少些。

4、DC系数的差分编码

8×8图像块经过DCT变换之后得到的DC直流系数有两个特点：

1、系数的数值比较大
2、相邻8×8图像块的DC系数值变化不大：冗余。

根据这个特点，JPEG算法使用了差分脉冲调制编码(DPCM)技术，对相邻图像块之间量化DC系数的差值DIFF进行编码：\(DIFF_k =DC_k - DC_{k-1}\)

此编码表并不是一成不变的，不同的文件有不同的码表。以此码表为例，DC=8，上一个DC=5时，则DIFF=8-5=3，类别ID=2，类内索引=3，则码流为10011。

5、AC系数的Z字扫描

由于经DCT变换后，系数大多数集中在左上角，即低频分量区，因此采用Z字形按频率的高低顺序读出，可以出现很多连零的机会。可以使用游程编码。尤其在最后，如果都是零，给出EOB (End of Block）即可。

6、AC系数的游程编码

首先，进行游程编码（RLC），并在最后加上块结束码（EOB）；然后，系数序列分组，将非零系数和它前面的相邻的全部零系数分在一组内；每组用两个符号表示[（Run，Size），（Amplitude）]
其中，Amplitude：表示非零系数的幅度值；Run：表示零的游程即零的个数；Size：表示非零系数的幅度值的编码位数

解码重构与编码相反

1、解码Huffman数据
2、解码DC差值
3、重构量化后的系数
4、DCT逆变换
5、丢弃填充的行/列
6、反零偏置
7、对丢失的Cb Cr分量差值（下采样的逆过程）
8、Y Cb Cr ->R G B

二、JPEG文件格式

Segment 的组织形式 JPEG 在文件中以 Segment 的形式组织，它具有以下特点：

均以 0xFF 开始，后跟 1 byte 的 Marker 和 2 byte 的 Segment length（包含表示 Length 本身所占用的 2 byte，不含“0xFF” + “Marker” 所占用的 2 byte）；
采用 Motorola 序（相对于 Intel 序），即保存时高位在前，低位在后；
Data 部分中，0xFF 后若为 0x00，则跳过此字节不予处理

Short name	Bytes	Payload	Name
SOI	0xFFD8	None	Start of Image
SOF0	0xFFC0	Variable Size	Start Of Frame(Baseline DCT)
SOF2	0xFFC2	Variable Size	Start Of Frame(Progressive DCT)
DHT	0xFFC4	Variable Size	Define Huffman Table(s)
DQT	0xFFDB	Variable Size	Define Quantization Table(s)
DRT	0xFFDD	4 Bytes	Define Restart Interval
SOS	0xFFDA	Variable Size	Start Of Scan
RSTn	0xFFDn	None	Restart
APPn	0xFFEn	Variable Size	Application-specific
COM	0xFFFE	Variable Size	Comment
EOI	0xFFD9	None	End Of Image

三、JPEG解码

下面我们对JPEG解码流程进行简要说明。

struct huffman_table，struct component，struct jdec_private三个结构体设计的目的如下：

struct jdec_private处于最上层，支配整个图像，其中包有 struct huffman_table和struct component。
struct huffman_table用来存放DC系数和AC系数的Huffman表
struct component用来存放8x8数据块组成的MCU即最小数据单元的数值，相当于移动像块，每次访问下一像块就给该结构体更新数值。

/* tinyjpeg-internal.h */

struct huffman_table
{
  /* Fast look up table, using HUFFMAN_HAS

最低0.47元/天解锁文章