
音视频编解码
文章平均质量分 67
threewells_14
这个作者很懒,什么都没留下…
展开
-
流媒体技术探讨
流媒体技术探讨流媒体技术探讨... 1一、可扩展性视频编码技术... 21、非扩展性视频编码流式技术... 22、传统的分层可扩展性编码... 33、精细的可扩展性编码... 4二、H.264的网络“亲和性”. 41、H.264在视频编码层的差错控制... 42、H.264在网络提取层的差错控制... 6三、在H.264中结合可扩展性视频编码技术... 61转载 2006-12-06 21:55:00 · 3315 阅读 · 0 评论 -
宏块与宏块对(附图)
假设 A、B 是上下相邻的两个 MB:在非宏块对的情况下:A、B宏块序号不连续,相差图像一行宏块个数。即按光栅扫描顺序编号。在帧宏块对的情况下:A、B宏块序号连续,即按锯齿扫描顺序编号。A、B 组成不变。A 称为顶帧宏块,B 称为低帧宏块。在场宏块对的情况下:A、B宏块序号连续,即按锯齿扫描顺序编号。但是这个时候的 A 是由原来 A、B 两个宏块中的奇数行像素组成,称为顶场宏块;而 B 是由原来转载 2007-02-15 09:25:00 · 1797 阅读 · 1 评论 -
DCT变换的一些知识
MPEG采用了Ahmed(一个巨牛的数学家) 等人于70年代提出的离散余弦变换(DCT-Discrete Cosine Transform)压缩算法,降低视频信号的空间冗余度。DCT将运动补偿误差或原画面信息块转换成代表不同频率分量的系数集,这有两个优点:其一,信号常将其能量的大部分集中于频率域的1个小范围内,这样一来,描述不重要的分量只需要很少的比特数;其二,频率域分解映射了人类视觉系统的处理过转载 2007-07-18 19:45:00 · 2612 阅读 · 0 评论 -
H.264涉及算法
一、帧间预测1、树形结构的运动补偿(自适应分块尺寸法,即如何选择为图像帧的每个部分选择最好的分块尺寸)2、插值算法(针对运动矢量的小数级像素精度而进行的像素插补) 1)六阶有限冲击相应滤波器(针对亮度的半像素点) 2)线形插补(针对亮度的四分之一像素) 3)八分之一像素精度插补(针对色度)3、运动矢量预测4、能量测量方法 1)MAE 2)MSE 3)SAE转载 2007-08-02 20:10:00 · 1640 阅读 · 0 评论 -
几种代价函数
SAD(Sum of Absolute Difference)=SAE(Sum of Absolute Error)即绝对误差和 SATD(Sum of Absolute Transformed Difference)即hadamard变换后再绝对值求和 SSD(Sum of Squared Difference)=SSE(Sum of Squared Error)即差值的平方和 MAD(Mean转载 2007-08-02 20:20:00 · 6427 阅读 · 0 评论 -
基于MMX指令集的程序设计简介
MMX技术简介 Intel 公司的MMX™(多媒体增强指令集)技术可以大大提高应用程序对二维三维图形和图象的处理能力。Intel MMX技术可用于对大量数据和复杂数组进行的复杂处理,使用MMX技术可处理的数据基本单位可以是字节(byte)、字(word),或者是双字(double-word)。Visual Studio .NET 2003提供了对MMX指令集特性的支持,从而可以不必编写汇转载 2007-05-11 10:46:00 · 859 阅读 · 0 评论 -
有关音频编码的知识与技术参数(转载)
自然界中的声音非常复杂,波形极其复杂,通常我们采用的是脉冲代码调制编码,即PCM编码。PCM通过抽样、量化、编码三个步骤将连续变化的模拟信号转换为数字编码。1、什么是采样率和采样大小(位/bit)? 声音其实是一种能量波,因此也有频率和振幅的特征,频率对应于时间轴线,振幅对应于电平轴线。波是无限光滑的,弦线可以看成由无数点组成,由于存储空间是相对有限的,数字编码过程中,必须对弦线的点进行采样。采转载 2007-05-23 15:12:00 · 1093 阅读 · 0 评论 -
wav文件格式分析详解
一、综述 WAVE文件作为多媒体中使用的声波文件格式之一,它是以RIFF格式为标准的。RIFF是英文Resource Interchange File Format的缩写,每个WAVE文件的头四个字节便是“RIFF”。 WAVE文件是由若干个Chunk组成的。按照在文件中的出现位置包括:RIFF WAVEChunk, Format Chunk, Fact Chunk(可选), Data转载 2007-05-23 15:14:00 · 1649 阅读 · 0 评论 -
如何利用Video4Linux获取摄像头数据
Video4Linux是Linux下用于获取视频和音频数据的API接口,在这篇文章中,着重阐述如何利用Video4Linux获取摄像头数据,以实现连续影像的播放。 1. 摄像头的安装 在Linux下常用的摄像头驱动是spca5xx, 这是一个通用驱动,读者可以在以下网站下到这个驱动 http://mxhaard.free.fr/download.html。这个网站还给出了这款驱动支持转载 2008-01-31 20:25:00 · 1034 阅读 · 0 评论 -
MBAFF时相邻宏块的获取过程(附图)
以标准(200503版)中表 6-4 的第一行为例进行说明,其余情况可依此做类似分析: 当 currMbFrameFlag = 1,mbIsTopMbFlag = 11、确定当前宏块左上角像素在帧图像中对应的像素点:currMbFrameFlag = 1,mbIsTopMbFlag = 1:当前宏块为顶帧宏块,其左上角像素的对应像素点(co-located pixel)为 c2、确定相邻像转载 2007-02-15 09:21:00 · 1641 阅读 · 0 评论 -
h.264 SODB RBSP EBSP的区别
SODB 数据比特串-->最原始的编码数据 RBSP 原始字节序列载荷-->在SODB的后面填加了结尾比特(RBSP trailing bits 一个bit“1”)若干比特“0”,以便字节对齐。 EBSP 扩展字节序列载荷-->在RBSP基础上填加了仿校验字节(0X03)它的原因是: 在NALU加到Annexb上时,需要填加每组NALU之前的开始码StartCodePrefix,如果原创 2007-02-12 19:48:00 · 11775 阅读 · 0 评论 -
24位BMP转8位BMP
// 24bit28bit.cpp : Defines the entry point for the console application.//#include "stdafx.h"#include "24bit28bit.h"#ifdef _DEBUG#define new DEBUG_NEW#undef THIS_FILEstatic char THIS_FILE[] = __FI转载 2006-12-14 20:48:00 · 3683 阅读 · 0 评论 -
调用Xvid编码器流程(基于xvid1.1.0)
xvid有两种编码方式:single pass和twopass single pass模式编码简单,速度也快,但最终效果不如twopass。 twopass就是视频压制需要经过两次编码,分别为twopass-1st pass(简称1pass)和twopass-2nd pass(简称2pass) 1pass时,编码器会用最高质量编码采集可供第2次运算参考的画面信息,而在2 pass时。编码器会转载 2006-12-14 19:29:00 · 2312 阅读 · 0 评论 -
MV预测过程详解
MV预测过程详解===========第一步:确定相邻块=========== MV 预测以宏块分割(或亚宏块分割,如果宏块存在亚分割)为单位,同一个宏块分割(或亚宏块分割)内所有 4*4 块 MV 预测值相同。以每个宏块分割(或亚宏块分割)的左上角像素 pixel1 和右上角像素 pixel2 为参考点来确定相邻块则: pixel1 左侧相邻像素所在 4*4 块为当前宏转载 2007-01-01 11:42:00 · 1507 阅读 · 2 评论 -
x264源码阅读笔记2
写参数集x264_sps_write()和x264_pps_write()以及其中基本的bs_write()的过程。挺有意思,挺巧妙的。他们就是负责码流写入的过程,这个不同于写字节,直接COPY内存,用C语言实现对位的操作真的显得比较笨拙,但是这里代码还是很巧妙的。说基本的,static inline void bs_write( bs_t *s, int i_count, uint32_原创 2007-02-12 17:13:00 · 2122 阅读 · 0 评论 -
h.264的技术细节
H.264/AVC包含了一系列新的特征,使得它比起以前的编解码器不但能够更有效的进行编码,还能在各种网络环境下的应用中使用。这些新特性包括:多参考帧的运动补偿。比起以前的视频编码标准,H.264/AVC以更灵活的方式使用已编码的更多帧来作为参考帧。在某些情况下,可以使用最多32个参考帧(在以前的标准里面,参考帧的数目不是1就是对B帧来说的2)。该特性对大多数场景序列都可以带来一定的码率降低或者质量转载 2007-02-13 16:32:00 · 1946 阅读 · 0 评论 -
Skip宏块与Direct预测模式浅析
B_Skip类型宏块(200503版标准,表7-14最后一行): 无像素残差,无运动矢量残差(MVD)。解码时,通过Direct预测模式(时间或空间)计算出前、后向MV后,直接利用前、后向MV得到像素预测值。像素重构值=像素预测值 B_Direct_16*16类型宏块(200503版标准,表7-14第一行):有像素残差,无运动矢量残差(MVD)。解码时,通过Dire转载 2007-02-15 10:26:00 · 2196 阅读 · 0 评论 -
x264源码阅读笔记1
终于有时间读源码了,终于有时间写点心得了,省得以后看过就忘,记的虽然没啥东西,只是为了过了几个月后知道自己曾经看过X264源码吧。开始好几天不知从何入手,前几天终于把那几个参考帧队列是咱么回事看了个大概,就简单说说吧。虽然网上有很多人读过了也写过编码流程啥的,但是自己看了都基本上是不知所云,自己的东西应该用自己的语言写出来。所以我就用自己的语言,或大白话记录下。刚开始那些分析输入参数,就不原创 2007-02-12 17:01:00 · 2526 阅读 · 0 评论 -
video4linux
利用Video4Linux获取摄像头数据 Video4Linux是Linux下用于获取视频和音频数据的API接口,在这篇文章中,我着重阐述如何利用Video4Linux获取摄像头数据,以实现连续影像的播放。 1. 摄像头的安装在Linux下常用的摄像头驱动是spca5xx, 这是一个通用驱动,读者可以在以下网站下到这个驱动 http://mxhaard.free.fr/download.html。转载 2008-01-31 20:17:00 · 1507 阅读 · 0 评论