自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 实验七 | H.264编码实验

H.264编码实验**一、定性分析**(一)、实验要求1、选择一个.mp4或者.264文件。2、在码流分析仪软件中打开该文件,从几个层次进行分析:(1)分析SPS和PPS里都包含哪些主要的信息,给出参数值。(例如分辨率、帧率、GOP结构等等)(2)以一个GOP为例,分析如下信息:每个图像帧的类型及所用的编码比特数、QP值;并以图像帧号为横坐标、每帧所用比特数为纵坐标画出曲线图;以图像帧号为横坐标、每帧所用QP为纵坐标画出曲线图。以第一个I帧作为分析对象,基于该帧图像的空间特性,分析每个

2021-06-29 23:30:44 617

原创 实验六 | MPEG音频编码

**MPEG音频编码**一、实验要求1、输出音频的采样率和目标码率2、 选择三个不同特性的音频文件(噪声、音乐、混合),对于某个数据帧,输出该帧所分配的比特数该帧的比例因子该帧的比特分配结果二、实验原理MPEG-1 Audio LayerII编码器原理采用感知音频编码,基本思想是利用心理声学模型分析信号并去掉不能被感知的部分,去冗余使得编码效率提高。1、心理声学模型听觉系统中存在一个听觉阈值电平,低于这个电平的声音信号就听不到;听觉掩蔽特性,即听觉阈值电平是自适应的,会随听

2021-06-15 16:23:18 354

原创 实验五 | JPEG编解码原理及解码器的调试

JPEG解码

2021-06-06 17:40:11 764 3

原创 3 | 随机信号的参数建模法

随机信号的参数建模法(Modern modeling method for signal)一、基本介绍二、3种参数模型1、MA模型随机信号x(n)由当前的激励w(n)和若干次过去的激励w(n-k) 线性组合产生:该模型的系统函数:系统函数只有零点,没有极点,所以该系统一定是稳定的系统,也称为全零点模型,用 MA( q )来表示。2、AR模型随机信号x(n)由本身的若干次过去值x(n-k)和当前的激励值w(n)线性组合产生:该模型的系统函数是:p 是系统阶数,系统函数中只有极点

2021-06-05 17:42:39 610 1

原创 实验四 | DPCM 压缩系统的实现和分析

DPCM压缩系统的实现和分析一、实验目的掌握DPCM编解码系统的基本原理。初步掌握实验用C/C++/Python等语言编程实现DPCM编码器,并分析其压缩效率。二、实验原理1、DPCM编解码原理差分预测编码是预测器的输入是已经解码以后的样本。之所以不用原始样本来做预测,因为在解码端无法得到原始样本,只能得到存在误差的样本。因此,在DPCM编码器中实际内嵌了一个解码器。2、DPCM编码系统的设计在本次实验中,我们采用固定预测器和均匀量化器。预测器采用左侧、上方预测均可。量化器采用8比特均匀量化

2021-04-26 17:28:24 238

原创 实验三 | LZW 编解码算法实现与分析

LZW 编解码算法实现与分析**一、实验目的**掌握词典编码的基本原理,用C/C++/Python等语言编程实现LZW解码器并分析编解码算法1.LZW编码原理和实现算法步骤1:将词典初始化为包含所有可能的单字符,当前前缀P初始化为空。步骤2:当前字符C=字符流中的下一个字符。步骤3:判断P+C是否在词典中(1)如果“是”,则用C扩展P,即让P=P+C,返回到步骤2。(2)如果“否”,则输出与当前前缀P相对应的码字W;将P+C添加到词典中;令P=C,并返回到步骤22.LZW解码原

2021-04-21 20:18:23 337

原创 实验二 | BMP序列转YUV文件

一、实验要求在图像处理软件中自行生成多个BMP文件,至少含5个不同画面,带有班级、学号、姓名的logo。基本要求为24bit的BMP文件(32bit 16bit 8bit)编写将生成的多个BMP文件转化为YUV文件,要求可在命令行中设置每个画面出现的帧数。最后形成的BMP文件应至少包含200帧调试程序播放生成的YUV文件二、基本思路24bit的BMP文件结构简单,数据BGRBGR…依次排列,利用结构体获得图像宽高进而读取数据存放于缓冲区,利用已有的rgb2yuv.cpp函数文件可以直接转换为

2021-04-06 22:51:50 194

原创 2 | TGA文件格式分析

TGA文件格式分析关于TGA的简介:TGA文件格式的结构比较简单,属于一种图形,图像数据的通用格式,在多媒体领域有着很大影响,是计算机生成图像向电视转换的一种首选格式。TGA图像格式最大的特点是可以做出不规则形状的图形、图像文件,一般图形、图像文件都为四方形,若需要有圆形、菱形甚至是缕空的图像文件时,TGA可就派上用场,TGA格式支持压缩,使用不失真的压缩算法。(摘自百科)一、文件结构TGA原始文件结构(v1.0)文件头和图像/颜色表数据两部分组成TGA扩展文件结构(v2.0)

2021-03-24 21:55:49 699

原创 实验一 |彩色空间rgb和yuv的相互转换

彩色空间转换**一、实验目的**1.基本要求:编写RGB转化为YUV程序,重点掌握函数定义,部分查找表的初始化和调用,缓冲区分配。将得到的RGB文件转换为YUV文件,用YUV Viewer播放器观看,验证是否正确。2.提高要求:编写将YUV转换为RGB的程序。将给定的实验数据用该程序转换为RGB文件。并与原RGB文件进行比较,如果有误差,分析误差来自何处。**二、转换公式**1、RGB to YUV由电视原理可知,亮度和色差信号的构成如下:Y=0.2990R+0.5870G+0.

2021-03-19 10:58:34 736

原创 1.2| 分析rgb和yuv文件三个通道的概率分布并计算各自的熵

分析rgb和yuv文件三个通道的概率分布并计算各自的熵两个文件的分辨率均为256*256;yuv为4:2:0采样空间;存储格式为:rgb文件按每个像素BGR分量依次存放;YUV格式按照全部像素的Y数据块、U数据块和V数据块依次存放。一、思路分析读取rgb&yuv文件数据到三个数组中存储rgb文件按每个像素BGR分量依次存放:可知RGB分别有256*256个,排列为RGBRGBRGB…的形式yuv文件采用4:2:0采样:分别计算三个通道(RGB&YUV)的频数分

2021-03-07 19:01:13 301

原创 1.1| 浊音、清音、爆破音的时域频域分析

浊音、清音、爆破音的时域频域分析语音信号具有短时平稳性,因此以下所有的特性分析都基于短时分析技术语音的时域分析一般有四个重要参数:短时能量、短时过零率、 短时自相关函数 、短时平均幅度差函数语音的频域分析常用方法:带通滤波器组法、傅里叶变换法、线性预测法等一、浊音以/u/为例时域波形短时平均幅度最大,短时过零率最低。具有基音周期(浊音的特性)。频域波形可区分出较为明显的三个共振峰。能量集中在低频区域。二、清音以/t/为例时域波形短时平均幅度最小,短时过

2021-03-06 12:25:02 629

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除