- 博客(8)
- 收藏
- 关注
原创 MPEG音频编码实验
2.感知音频编码的设计思想(1) 两条线第一条线:时域越短提取到的样本点数越多,越能反映瞬时变化情况第二条线:把人耳的听觉特性转变成可计算的模型——心理声学模型,其输出类似听力曲线,以频率为横坐标,以能量为纵坐标。谱线间隔越小、频域的分解力越细越好。时频分析的矛盾频域的频谱分辨率和时域的变化率之间存在矛盾,时域信号取得越短,频域谱线间隔越大。3.心理声学模型的实现过程(1)临界频带的概念临界频带是指当某个纯音被以它为中心频率,且具有一定带宽的连续噪声所掩蔽时,如果该纯音刚好被听到时的功率等于
2022-06-30 20:08:36
148
原创 数据压缩实验JPEG
1.编码原理基本流程:1.亮度信号零偏置电平下移,对于灰度级是2n的像素,通过减去2n-1,将无符号的整数值变成是有符号数。这样做的目的是使像素的绝对值出现3位10进制的概率大大减少。2.DCT变换对每个单独的彩色图像分量,把整个分量图像分成8×8的图像块,并进行8×8DCT变换,目的是去除图像数据的相关性,便于量化过程去除图像数据的空间冗余。3.量化利用人眼视觉特性设计而成的矩阵量化DCT系数,减小视觉冗余。因为人眼对亮度信号比色差信号更敏感,因此使用了两种量化表:亮度量化值和色差量化值;根据人
2022-06-19 16:25:42
410
原创 DCPM差分预测编码
以本次实验为例,本次实验对图像的各个像素点进行压缩,并且采用左侧预测的方法,即每一个像素点的值输入后,与左边前一个像素点的预测值进行相减,随后经过量化与反量化得到差值,而后用来更新当前的预测值,并为下一个进来的值做准备,那么这个原理的实现过程中,误差的产生主要集中于量化与反量化之间产生的误差,采用不同的量化方式时误差也会不同。输出了两幅图像,是经过解码以后的图像,另外一幅是差值图像,由于差值有正有负,在这里预处理把差值都加上128,得到插值图像。原图像8比特误差图像8bit插值图像4bit插值看到已经
2022-06-05 14:36:04
387
原创 LZW算法
LZW的编码思想是不断地从字符流中提取新的字符串,然后用码字表示这个新字符串。这样用码字去替换字符流,生成码字流,可以达到压缩数据的目的。步骤1:将词典初始化为包含所有可能的单字符(常用ASCII码表),当前前缀P初始化为空。步骤2:当前字符C=字符流中的下一个字符。步骤3:判断P+C是否在词典中。(1)如果“是”,则用C扩展P,即让P=P+C,返回到步骤2。(2)如果“否”,则输出与当前前缀P相对应的码字W;将P+C添加到词典中;令P=C,并返回到步骤2。 LZW解码算法开始时,译码词典和
2022-06-05 12:00:34
739
原创 (数据压缩作业)BMP转YUV
典型的BMP图像文件由四部分组成:(1)位图头文件数据结构,它包含BMP图像文件的类型、显示内容等信息;(2)位图信息数据结构,它包含有BMP图像的宽、高、压缩方法,以及定义颜色等信息;(3)调色板,这个部分是可选的,有些位图需要调色板,有些位图,比如真彩色图(24位的BMP)就不需要调色板;(4)位图数据,这部分的内容根据BMP位图使用的位数不同而不同,在24位图中直接使用RGB,而其他的小于24位的使用调色板中颜色索引值。1.位图文件头 2.位图信息头3 调色板二 RGB
2022-06-05 10:40:42
148
原创 WAV格式文件分析
WAV格式文件分析WAV格式简介WAV是最常见的声音文件格式之一,是微软公司专门为Windows开发的一种标准数字音频文件,该文件能记录各种单声道或立体声的声音信息,并能保证声音不失真。它符合资源互换文件格式(RIFF)规范,用于保存Windows平台的音频信息资源,被Windows平台及其应用程序所广泛支持。Wave格式支持MSADPCM、CCITT A律、CCITT μ律和其他压缩算法,支持多种音频位数、采样频率和声道,是PC机上最为流行的声音文件格式;但其文件尺寸较大,多用于存储简短的声音片段。(
2022-06-04 11:36:23
291
原创 PNG格式文件分析
一、PGN文件简介是一种位图文件(bitmap file)存储格式,读成"ping"。PNG用来存储灰度图像时,灰度图像的深度可多到16位,存储彩色图像时,彩色图像的深度可多到48位,并且还可存储多到16位的α通道数据。二、PNG文件结构PNG文件一般由两大部分组成:1、文件头:Filehead,用来标识这是一个PNG格式的文件。该域的值为:十进制数137 80 78 71 13 10 26 10 十六进制数 89 50 4e 47 0d 0a 1a 0a2、其他部分:Chunks,
2022-06-04 09:09:01
1512
原创 【数据压缩作业】元音音频分析和图片rgb熵的计算
1.元音分析用Audacity软件来分析 a o e 元音aoe由图可以看出 ,这些元音的频谱都在特定的频率点上出现峰值,但是不同元音出现峰值的频率与峰值的幅度不相同,有明显的共振峰。放大其时域波形,可以看出其有短时平稳性的特点。二、实现RGB文件三通道分量的信息熵计算。代码实现如下:#include<stdio.h>#include<malloc.h>#include<string.h>#include<.
2022-03-20 14:47:05
385
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅