
多媒体
文章平均质量分 54
多媒体
SleepyPat
化整为零
有的放矢,心无旁骛
展开
-
[多媒体] OpenMax / DirectShow / FFmpeg
OpenMaxis anAPIspecification DirectShowis an API specification and an implementation of that API FFmpegprovides libraries, and libraries are implementations of API specifications参考:I'd like to know the relations among openmax, directshow and ffmpeg...原创 2022-01-17 11:00:56 · 369 阅读 · 0 评论 -
[多媒体] YUV相关知识
参考:Recommended 8-Bit YUV Formats for Video Rendering - Win32 apps | Microsoft Docs刻意练习FFmpeg系列:颜色和像素 - 知乎分类:YUV 分为 :YUV444 , YUV422 和 YUV420三种YUVabc 是什么意思:YUV 是模拟数据称呼,对应的数字数据应该是 YCrCb,他们都表示同一个东西,后面的数字abc 表示 “在一个 2*2 的矩阵中有a个Y,b个U,c个V ” 。注意:.原创 2021-10-18 17:33:16 · 3899 阅读 · 0 评论 -
[图像] RGB和YUV图像的数据是如何存储的
参考:https://blog.youkuaiyun.com/leixiaohua1020/article/details/50534150前言:图像都以像素为单位,但是不同数据格式图像(不是指图像文件格式)在存储数据(字节)时数据结构是不一样的。RGB:内存模型(1):数据是连续存储的,每个像素都由3个字节组成,因此对于 w*h 像素的 rgb 图像,则需要 3*w*h 个字节来表示内存模型(2):注:模型1和模型2都能表示图像,模型2更贴近图像的表示方式,模..原创 2021-02-24 17:54:02 · 2514 阅读 · 0 评论 -
[多媒体][视频]压缩 、编码、信息熵
为什么要编码?图像数据的原始数据量很大,因此在传输和存储之前需要进行压缩,否则占用的带宽开销和存储开销将是巨大的。因此需要对图像数据进行压缩,而压缩的一种手段就是对原数据进行编码。编码的一个重要目的是压缩,当然还有其他目的,比如加密。什么是信息熵?数据压缩会导致数据失真,或者说信息量丢失,这是显而易见的,但是同时也会带来数据量的缩减,那么如何衡量一个算法是否优秀呢?我们可以以 “损失的信息量与带来的数据压缩量的比率” 来表示一种信息量对数据量的比率关系。而用来表示信息量.原创 2021-10-28 10:28:43 · 893 阅读 · 0 评论 -
[多媒体] DTS 、PTS、时间基 和 B帧
DTS 和 PTSDTS : decode timestamp 解码时间戳PTS :present timestamp 展示时间戳如果 H264 数据流中没有 B 帧,那么每一真的 DTS 和 PTS 都应该是一样的,如果有B帧,那么PTS是具体画面的时间戳,标注了每一帧画面的实际展示时的时间点,因此PTS的值是递增的,而DTS则不再递增。例如:正常画面帧顺序为 : I1 B1 B2 P1 I2 B3 B4 B5 P2一般H264在流式传输的时候都是按照上面...原创 2021-10-28 11:19:22 · 862 阅读 · 0 评论 -
[多媒体] surface / layer / window 三者之间的关系
Window和Window之间,没有alpha blend作用,只有次序关系(ZOrder)。Surface和Surface之间,有alpha blend作用。Layer 和Layer之间,有alpha blend作用。原创 2023-01-29 15:17:50 · 698 阅读 · 0 评论 -
[多媒体]对矩阵压缩再还原
DCT 变换与量化表_maryhaocoolcool的博客-优快云博客_量化表背景知识:低频分量(低频信号)代表着图像中亮度或者灰度值变化缓慢的区域,也就是图像中大片平坦的区域,描述了图像的主要部分。主要对整幅图像强度的综合度量。高频分量(高频信号)对应着图像变化剧烈的部分,也就是图像的边缘(轮廓)或者噪声以及细节部分,主要是对图像边缘和轮廓的度量。DCT变换对图像进行压缩的原理是减少图像中的高频分量,高频主要是对应图像中的细节信息,而我们人眼对细节信息并不是...https://blog.csdn.ne原创 2021-10-27 18:35:19 · 1521 阅读 · 0 评论 -
[多媒体] 音视频编解码基础
音视频学习从零到整--H264编码原理 - 简书原创 2021-09-18 11:42:30 · 210 阅读 · 0 评论 -
[多媒体] 多媒体封装格式 —— MP4 vs MKV
MKV :完全免费MP4 :有专利保护。原创 2022-08-11 20:00:50 · 249 阅读 · 0 评论 -
[流媒体] ES流解析
H.264 将构成一帧图像所有NALU(network abstract layer unit)的集合称为一个AU(access unit) ,一个NALU 是一个最小网络传输单元,一个AU是一帧数据I think Technically speaking the only way to detect when a frame ends is to see where the next one begins. That means, you should search for the next...原创 2022-01-28 12:00:41 · 2148 阅读 · 0 评论 -
[多媒体] 关于H264的 profile 和 level
会涉及到对画面质量和某些参数的一些规格划分。这样才有助于多系统协同合作。原创 2023-01-28 10:16:06 · 899 阅读 · 0 评论 -
[多媒体] 音频的左右声道
左右声道的来源:我们知道,人耳之所以能准确辨别发音点的方位,是因为声源与双耳之间存在着角度差。这个角度差使声源传到左右耳的时候产生微小的时间差,而人耳对这微小的时间差非常敏感,从而使人能够产生准确的方向感。同时,这个角度差又使声源到达左右耳的距离产生微小的距离差,造成两只人耳在接收同一声音信号时的声音强度差,而人耳可以通过声音强弱的微小差异来判断声源离自己的距离。有了准确的方向和距离感,声像就可以得到准确的定位,这种原理被称为哈斯效应。正是通过对这种声像定位原理的逆向运用,人们发明了最早的也是最简单原创 2021-09-18 10:51:20 · 1834 阅读 · 0 评论 -
[多媒体] PGM格式图像详解
转:PGM格式图像详解_xiaoxin_ling的专栏-优快云博客NET framework框架类库中的Image类和Bitmap类提供了常用图像格式的解析读取和存储,这些常用格式包括BMP,JEPG,GIF,PNG,EXIF,TIFF.但是可惜的是不支持PGM格式,但是只要知道了PGM格式的文件的组织结构,相信要解析他也不是难事了.1.PGM图像详解PGM 是便携式灰度图像格式(portable graymap file format),在黑白超声图像https://blog.youkuaiyun.com/xi原创 2021-10-15 10:51:03 · 1142 阅读 · 0 评论 -
[多媒体]霍夫曼编码详解
霍夫曼编码(Huffman Coding)_summer-优快云博客_霍夫曼编码霍夫曼编码(Huffman Coding)是一种编码方法,霍夫曼编码是可变字长编码(VLC)的一种。霍夫曼编码使用变长编码表对源符号(如文件中的一个字母)进行编码,其中变长编码表是通过一种评估来源符号出现机率的方法得到的,出现机率高的字母使用较短的编码,反之出现机率低的则使用较长的编码,这便使编码之后的字符串的平均长度、期望值降低,从而达到无损压缩数据的目的。霍夫曼编码的具体步骤如下:https://blog.youkuaiyun.com原创 2021-10-28 09:21:43 · 761 阅读 · 0 评论 -
[多媒体] PCM linearPCM Dolby(Atmos 5.1 7.1)
PCM是对音频模拟信号等间隔取样后编码所得,较为能够还原原始模拟信号,可以认为是 无损音频格式,即没有压缩的,所以数据量较大。PCM 内部可以编制 最多10个 channel 音频,PCM也正是通过这种方式来实现立体声效果的。原创 2023-06-29 18:09:25 · 1870 阅读 · 0 评论