- 博客(10)
- 资源 (1)
- 收藏
- 关注
原创 【数据压缩】实验:MPEG音频编码
基本思想:分析信号,去掉不能被人耳感知的部分。整体框架:输入声音信号经过一个多相滤波器组,变换到多个子带。同时经过心理声学模型计算以频率为自变量的噪声掩蔽阈值。量化和编码部分用信掩比SMR决定分配给子带信号的量化位数,使量化噪声......
2022-07-03 22:48:24
418
原创 【数据压缩】实验:JPEG原理分析及JPEG解码器的调试
JPEG是Joint Photographic Experts Group(联合图像专家小组)的缩写,文件后缀名为.jpg或.jpeg,是最常用的图像文件格式。JPEG主要采用预测编码(DPCM)、离散余弦变换(DCT)以及熵编码的联合编码方式,从而去除冗余的图像和彩色数据,属于有损压缩格式,在获得极高的压缩率的同时能展现十分丰富生动的图像。JPEG图像压缩算法能够在提供良好的压缩性能的同时,具有比较好的重建质量,被广泛应用于图像、视频处理领域。(1)图像预处理(2)零偏置电平下移对输入图片做零偏置电平下移
2022-07-01 01:01:36
1880
原创 【数据压缩】实验:DPCM压缩系统的实现与分析
预测编码指根据某一模型利用旧的样本值对新样本值进行预测,然后将样本的实际值与其预测值相减得到误差值,对于这一误差值进行编码。如果模型足够好且样本序列在时间上相关性较强,那么误差信号的幅度将远远小于原始信号,从而得到较大的数据压缩结果。预测编码方法分线性预测和非线性预测编码方法。线性预测编码方法也称差值脉冲编码调制法,简称DPCM。DPCM编解码过程如下图:编码器(Encoder)中Q是量化器,P是预测器。输入信号Xn是某一像素点的实际灰度值,Pn是对该像素点的预测值,dn 是预测误差,^(dn)是量化预测误
2022-06-11 13:45:55
483
原创 【数据压缩】实验:H.264文件分析
H.264是由ITU-T视频编码专家组(VCEG)和ISO/IEC动态图像专家组(MPEG)联合组成的联合视频组(JVT)提出的高度压缩数字视频编解码器标准,这个标准通常被称为H.264/AVC。它是继MPEG-4之后的新一代数字视频压缩格式,具有更高的编码效率,注重对移动和IP网络的适应,并且提供了丰富的错误处理工具以控制或消除丢包和误码。H.264的功能分为两层:视频编码层(VCL, Video Coding Layer)和网络提取层(NAL, Network Abstraction Layer)。SP
2022-06-08 17:04:35
1176
原创 【数据压缩】实验1:将BMP文件转换为YUV文件
BMP文件简介位图文件(Bitmap-File,BMP)格式是Windows采用的图像文件存储格式,其位图文件默认的文件扩展名是bmp或者dib。BMP文件的图像深度可选1bit、4bit、8bit、16bit及24bit。BMP文件存储数据时,图像的扫描方式是按从左到右、从下到上的顺序。本实验的目的是在理解了BMP文件格式以及读写方法的基础上,将多个BMP文件转化为一个YUV文件,并在YUV文件中依次进行播放。BMP文件主要结构典型的BMP图像文件由四部分组成:1. 位图文件头
2022-05-14 00:36:22
417
原创 【数据压缩】实验LZW:第二类词典编码算法实现
LZW编码原理LZW的编码思想是不断地从字符流中提取新的字符串,然后用码字表示这个新字符串。这样用码字去替换字符流,生成码字流,可以达到压缩数据的目的。LZW编码是围绕称为词典的转换表来完成的。LZW编码器通过管理这个词典完成输入与输出之间的转换。LZW编码器的输入是字符流,字符流可以是用8位ASCII字符组成的字符串,而输出是用n位(例如12位)表示的码字流。LZW编码算法的步骤如下:步骤1:将词典初始化为包含所有可能的单字符,当前前缀P初始化为空; 步骤2:当前字符C=字符流中的下
2022-04-22 00:07:31
563
原创 【数据压缩】作业3:WAV文件格式分析+AVI文件问题回答
关于AVI文件的问题1. AVI文件音频和视频的数据是如何放置的?交织放置还是连续放置?AVI的全称为Audio Video Interleaved,即视音频交织,可见AVI文件的音频和视频是交织放置的。举例说明:在Visual Studio中使用二进制格式打开一个AVI文件,可以看到用十六进制显示的文件信息。2. AVI文件一个视频帧大约占据多少字节?一个音频数据块大约占用多少字节?...
2022-04-20 19:55:23
320
原创 【数据压缩】作业2:PNG图像格式分析
一、PNG概述PNG是一种采用无损压缩算法的位图格式,支持索引、灰度、RGB三种颜色方案以及alpha通道等特性。PNG用来存储灰度图像时,灰度图像的深度可多到16位;存储彩色图像时,彩色图像的深度可多到48位,并且还可存储16位的α通道数据。二、PNG特点文件体积小 索引彩色模式 支持附加文本信息 支持无损压缩 逐次逼近显示 支持透明效果三、PNG文件结构PNG图像格式由文件署名和数据块(chunk)组成,我将以下图为例辅助进行PNG图像格式分析。3.1 文件署名域
2022-03-31 23:58:39
1359
原创 【数据压缩】作业1-2:计算RGB文件三通道分量的熵
已知测试文件test.rgb的分辨率为256*256,每个像素占用3字节,存储格式为BGRBGRBGR...打开rgb文件,读入数据:unsigned char* buffer_in; int image_size = 256 * 256;buffer_in = (unsigned char*)malloc(image_size * 3); FILE* fp;errno_t err1 = fopen_s(&fp, "E://数据压缩//01作业//test.rgb", "rb"
2022-03-18 12:15:02
129
原创 【数据压缩】作业1-1:对浊音、清音、爆破音进行音频分析
本次实验利用Audacity软件分别对浊音、清音、爆破音进行时域和频域的分析与研究。一、浊音浊音指发音时声带振动的音,此处以拼音“a”为例。时域分析由图可见,浊音a的时域波形较为均匀平缓,进一步放大观察:可见浊音时域波形具有短时周期性。频域分析由图可见,浊音频谱能量主要集中在200~2000Hz范围内,且具有正弦函数的特性。波形起伏较大,波峰较多且分布较为均匀。二、清音清音指发音时声带不振动的音,此处以拼音“s”为例。时域分析由图可见,清音s...
2022-03-18 00:19:46
508
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人