Coding:简单介绍视音频采样和量化01.

最新推荐文章于 2024-08-15 17:52:00 发布

原创最新推荐文章于 2024-08-15 17:52:00 发布 · 951 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

Coding 专栏收录该内容

2 篇文章

订阅专栏

本文简要介绍了视音频编码中的采样和量化过程，包括空间、时间和声音采样，以及奈奎斯特定理。内容涵盖采样率、量化、色彩深度和伽马校正等基础知识。

额..最近一段时间一直在学习视音频编码压缩采样这块…

此篇文章是来自我自己前段时间总结的OneNote部分学习笔记呢;

如果有写得不对的地方.还有望大家多多指教的说！！

本文主要简单介绍了空间.时间.声音采样的原理与流程.还有一些奈圭斯特频率的知识。

2.1采样和量化。

光和声音以连续不断的模拟志存在.这些值组成了无穷的颜色细节和响度频率。模拟转数字必须缩减到离散比特和字节有限范围内.就是采样量化。采样界定测量的点或区域.量化界定了实际记录的值。

2.1.1空间采样。模拟照片用扫描仪扫需要用每英寸的点数指定一个分辨率。采样是把图像分解为离散的碎片pel。网络编码器大多采用方形像素.DV和ITU-R BT.601是长方形的。

2.1.2时间采样。

单位 f/s和Hz

运动15f/s 声音同步24f/s

2.1.3声音采样。

音频数据率较低。响度本质是任一给定的时刻的空气压力。电线中电压变化影响响度.对响度变化进行采样的频率称为采样率。 44.1khz 每秒44110次。

22.05 32 48 96 192。

2.1.4奈圭斯特频率。

任意信号的采样率至少要两倍于该信号的频率才能准确地再现信号。频率信号可以是空间.时间.声音的。

如果你的屏幕是640像素宽屏.影像中最多只有320个变化量不会出错。低于频率会导致我们得到的影像和源影像不一样。缩放降低影像分辨率时可能会出现这种问题。

2.1.5量化。

量化就是把离散的数值指派给每个样本理论上无穷尽的可能值(分配)。可用数值范围较宽的量化更精细比特和文件大小就更大.范围较小的量化更粗糙比特和文件大小就更小。不同样本的量化标准不同.选择最理想的.就是最适合的。

量化后一切就都被转成数字了。每个字节有8比特.每个比特有0和1.这些字节是以2的乘方成组。每增加1bit就能把采样分辨率加倍。中间数可以节省存储空间.速度是一样的。

量化视频

样本单独一个方块的颜色只能是一个颜色。像素.色彩深度决定量化后的细节数量。大多数视频编解码器采用的是每通道8bit。8bit视频提供了256级的亮度(0-255).足可以提供非常高质量的视频呈现。YCrCb(YUV)色彩空间视频系统典型只采用了219级的亮度级别(16-235).而RGB采用的就是256个。两者都是8bit数字量化。人眼感光大概有1％的差异。量化的尺度采用固定比例而不是光线水平.我们把这称为视觉均匀。在视觉均匀的亮度尺度上.亮度百分比从20到21和200到201都是差不多的。使尺度保持视觉均匀的指数增长称为伽马。如今的视频编解码器的名义值是统一的2.2。

2.1.6曲线和超8bit？。

主流位数有8bit 10bit和12bit。

嗯..这次就先搬运这么多吧…日后会慢慢整理好后更新的说~

博主正在慢慢消化中~~

PS:颜色色彩空间部分下次再慢慢详谈。

@本地磁盘姬整理

ohayou.moeres.org

微博@萌萌的本地磁盘w

2016年11月13日

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。