jehhdhdd-优快云博客

原创 MPEG音频编码实验

2.感知音频编码的设计思想（1）两条线第一条线：时域越短提取到的样本点数越多，越能反映瞬时变化情况第二条线：把人耳的听觉特性转变成可计算的模型——心理声学模型，其输出类似听力曲线，以频率为横坐标，以能量为纵坐标。谱线间隔越小、频域的分解力越细越好。时频分析的矛盾频域的频谱分辨率和时域的变化率之间存在矛盾，时域信号取得越短，频域谱线间隔越大。3.心理声学模型的实现过程（1）临界频带的概念临界频带是指当某个纯音被以它为中心频率，且具有一定带宽的连续噪声所掩蔽时，如果该纯音刚好被听到时的功率等于

2022-06-30 20:08:36 148

原创数据压缩实验JPEG

1.编码原理基本流程：1.亮度信号零偏置电平下移，对于灰度级是2n的像素，通过减去2n-1,将无符号的整数值变成是有符号数。这样做的目的是使像素的绝对值出现3位10进制的概率大大减少。2.DCT变换对每个单独的彩色图像分量，把整个分量图像分成8×8的图像块，并进行8×8DCT变换，目的是去除图像数据的相关性，便于量化过程去除图像数据的空间冗余。3.量化利用人眼视觉特性设计而成的矩阵量化DCT系数，减小视觉冗余。因为人眼对亮度信号比色差信号更敏感，因此使用了两种量化表：亮度量化值和色差量化值；根据人

2022-06-19 16:25:42 410

原创 DCPM差分预测编码

以本次实验为例，本次实验对图像的各个像素点进行压缩，并且采用左侧预测的方法，即每一个像素点的值输入后，与左边前一个像素点的预测值进行相减，随后经过量化与反量化得到差值，而后用来更新当前的预测值，并为下一个进来的值做准备，那么这个原理的实现过程中，误差的产生主要集中于量化与反量化之间产生的误差，采用不同的量化方式时误差也会不同。输出了两幅图像，是经过解码以后的图像，另外一幅是差值图像，由于差值有正有负，在这里预处理把差值都加上128，得到插值图像。原图像8比特误差图像8bit插值图像4bit插值看到已经

2022-06-05 14:36:04 387

原创 LZW算法

LZW的编码思想是不断地从字符流中提取新的字符串，然后用码字表示这个新字符串。这样用码字去替换字符流，生成码字流，可以达到压缩数据的目的。步骤1：将词典初始化为包含所有可能的单字符（常用ASCII码表），当前前缀P初始化为空。步骤2：当前字符C=字符流中的下一个字符。步骤3：判断P＋C是否在词典中。（1）如果“是”，则用C扩展P，即让P=P＋C，返回到步骤2。（2）如果“否”，则输出与当前前缀P相对应的码字W；将P＋C添加到词典中；令P=C，并返回到步骤2。 LZW解码算法开始时，译码词典和

2022-06-05 12:00:34 739

原创（数据压缩作业）BMP转YUV

典型的BMP图像文件由四部分组成：（1）位图头文件数据结构，它包含BMP图像文件的类型、显示内容等信息；（2）位图信息数据结构，它包含有BMP图像的宽、高、压缩方法，以及定义颜色等信息；（3）调色板，这个部分是可选的，有些位图需要调色板，有些位图，比如真彩色图（24位的BMP）就不需要调色板；（4）位图数据，这部分的内容根据BMP位图使用的位数不同而不同，在24位图中直接使用RGB，而其他的小于24位的使用调色板中颜色索引值。1.位图文件头 2.位图信息头3 调色板二 RGB

2022-06-05 10:40:42 148

原创 WAV格式文件分析

WAV格式文件分析WAV格式简介WAV是最常见的声音文件格式之一，是微软公司专门为Windows开发的一种标准数字音频文件，该文件能记录各种单声道或立体声的声音信息，并能保证声音不失真。它符合资源互换文件格式（RIFF）规范，用于保存Windows平台的音频信息资源，被Windows平台及其应用程序所广泛支持。Wave格式支持MSADPCM、CCITT A律、CCITT μ律和其他压缩算法，支持多种音频位数、采样频率和声道，是PC机上最为流行的声音文件格式；但其文件尺寸较大，多用于存储简短的声音片段。（

2022-06-04 11:36:23 291

原创 PNG格式文件分析

一、PGN文件简介是一种位图文件(bitmap file)存储格式，读成"ping"。PNG用来存储灰度图像时，灰度图像的深度可多到16位，存储彩色图像时，彩色图像的深度可多到48位，并且还可存储多到16位的α通道数据。二、PNG文件结构PNG文件一般由两大部分组成：1、文件头：Filehead，用来标识这是一个PNG格式的文件。该域的值为：十进制数137 80 78 71 13 10 26 10 十六进制数 89 50 4e 47 0d 0a 1a 0a2、其他部分：Chunks，

2022-06-04 09:09:01 1512

原创【数据压缩作业】元音音频分析和图片rgb熵的计算

1.元音分析用Audacity软件来分析 a o e 元音aoe由图可以看出，这些元音的频谱都在特定的频率点上出现峰值，但是不同元音出现峰值的频率与峰值的幅度不相同，有明显的共振峰。放大其时域波形，可以看出其有短时平稳性的特点。二、实现RGB文件三通道分量的信息熵计算。代码实现如下：#include<stdio.h>#include<malloc.h>#include<string.h>#include&lt.

2022-03-20 14:47:05 385

jehhdhdd的博客