解码AV1：视频编码的未来之光？_aom av1编码器优化-优快云博客

AV1，全称 AOMedia Video 1，是一种开源、免版税的编解码器，由开放媒体联盟（AOMedia）开发。这个联盟来头可不小，成员囊括了 Amazon、Cisco、Google、Intel、Microsoft、Mozilla、Netflix 等一众行业巨头，于 2015 年成立，目标就是打造一款能在互联网和其他市场广泛应用的开源视频编解码器。2018 年，AV1 正式发布，它的诞生有着特殊意义，旨在取代谷歌的 VP9，并与 HEVC（H.265）竞争。

VP9 是谷歌开发的开放视频编码格式，虽然有着高压缩率、高画质以及无专利费用的优点，还被广泛应用于 YouTube 的高清视频流，但由于它由谷歌主导，行业内担心重要的国际标准被单个独立巨头垄断。而 HEVC（H.265）虽然在编码性能和带宽节省率上表现出色，同样清晰度水平下码率至少能下降 40% 以上，未来在企业级市场上的推广普及趋势明显，可其复杂专利结构导致较高的许可费用，创立之初也未充分考虑网页播放的友好性，复杂的算法还让解码端异常吃力。AV1 则结合了 VP9 免费开源、浏览器友好性等优势，同时开发维护权在非盈利中立标准组织 AOM 手里，很好地解决了上述问题。

在性能上，AV1 相比之前的编码标准有着显著提升。它的压缩率比流行的 H.264 格式高 50%、比 VP9 格式高 20%。这意味着在相同的视频质量下，AV1 编码的视频文件将占用更少的存储空间和带宽，对于视频平台来说，能节省大量的存储和传输成本；对于用户而言，在有限的网络带宽下，也能更流畅地观看高清视频。

二、AV1 诞生的背景

AV1 的诞生有着深刻的行业背景，主要源于两个关键因素：高昂的专利费用和潜在的垄断风险。

先说说专利费用。H.265 虽然编码性能出色，但它的专利费用和授权政策堪称复杂。市面上有三个 H.265 专利池，像 MPEG LA、HEVC Advance 和 Velos Media，还有 Technicolor 公司单独收取授权费。就拿 HEVC Advance 来说，收费范围极其广泛，涵盖电视、智能手机、流媒体播放器等几乎所有硬件终端，以及 Netflix、YouTube 这样的内容提供商。终端设备要缴纳 0.2 - 1.2 美元不等的费用，封顶年费 4000 万美元；内容提供商除了给终端用户免费内容的，其他也要根据订阅数、节目数和媒体数收费，封顶年费 500 万美元。如此算下来，每年交给这些专利池和公司的 H.265 专利许可封顶费用超过 1 亿美元，这对很多企业来说是难以承受的高昂成本。

再谈谈垄断风险。H.265 的昂贵催生了谷歌的 VP9。VP9 免费开源，解码难度还相对较低，听起来似乎是个完美解决方案。但问题在于，如果 VP9 被广泛采用，这么重要的国际标准就会被谷歌这一个独立巨头掌控，这就像是把行业的命脉交到一家公司手里，风险巨大。所以在企业级市场，大家大多还是侧重于 HEVC/H.265，基于 VP9 的产品很少见，毕竟没人愿意让行业标准被一家公司垄断。

正是在这样的背景下，AV1 应运而生。它结合了 VP9 免费开源的优势，同时由非盈利中立标准组织 AOM 开发维护，既解决了专利费用的难题，又避免了被单个公司垄断的风险，为视频编码领域带来了新的希望。

三、AV1 的特点

（一）高效压缩

AV1 的高效压缩特性堪称一绝，这也是它在视频编码领域备受瞩目的关键原因。在如今这个高清、超高清视频盛行的时代，视频文件的大小和传输所需的带宽成了大问题。AV1 就像是一位神奇的 “瘦身大师”，在相同视频质量下，能让文件占用的存储空间和传输所需带宽大幅减少。

与传统的 H.264 编码格式相比，AV1 的压缩率要高 50% 。举个例子，一部原本用 H.264 编码，大小为 1GB 的 1080p 高清电影，如果用 AV1 编码，文件大小可能就只有 667MB 左右，一下子节省了约三分之一的存储空间。在带宽方面，假设播放这部电影，H.264 编码需要 5Mbps 的带宽才能流畅播放，而 AV1 编码可能只需要 3Mbps 左右的带宽，大大降低了对网络带宽的要求。这对于在线视频平台来说，意味着可以在有限的服务器存储和网络带宽条件下，存储和传输更多的视频内容，节省了大量的成本。像 Netflix 这样的大型流媒体平台，每天要处理海量的视频数据，采用 AV1 编码后，每年能在存储和带宽上节省数百万美元的成本。

相较于后来出现的 HEVC（H.265）编码格式，AV1 的压缩率同样具有优势，比 HEVC 还要高出约 30% 。这使得 AV1 在处理高分辨率、高帧率视频时，优势更加明显。在 8K 超高清视频领域，文件大小往往非常庞大，传输和存储成本极高。使用 AV1 编码，就可以在保证视频画质的前提下，有效降低文件大小和传输带宽需求，让 8K 视频的普及变得更加可行。随着 5G 网络的普及，人们对高清视频的需求越来越高，AV1 的高效压缩特性将为视频行业带来更多的发展机遇。

（二）开放和免费

AV1 另一个极具吸引力的特点就是它的开放性和免费性。在视频编码领域，专利费用和授权政策一直是影响技术推广和应用的重要因素。像 HEVC（H.265）编码格式，虽然编码性能出色，但由于其复杂的专利结构，使用它需要向多个专利池和公司支付高昂的专利许可费用，这让很多企业望而却步。

AV1 则完全不同，它是完全开放且免版税的。这对于开发者和内容创作者来说，简直就是福音。开发者在开发相关视频应用和产品时，不用担心专利侵权的问题，也无需支付任何专利费用，可以将更多的精力和资源投入到产品的创新和优化中。内容创作者在制作和发布视频时，也不用担心因为使用 AV1 编码而产生额外的费用，能够更加自由地创作和分享自己的作品。

这种开放和免费的特性，也促进了视频行业的创新和发展。越来越多的开源项目开始支持 AV1 编码，各种基于 AV1 的视频处理工具和应用不断涌现。一些小型视频创业公司，因为 AV1 的免版税特性，降低了创业成本，能够更加轻松地进入市场，与大型企业竞争。AV1 的开放和免费也有助于打破视频编码领域的垄断，推动整个行业的健康发展，让更多的消费者能够享受到高质量、低成本的视频服务。

四、AV1 的技术细节

（一）分区

AV1 在分区上采用了独特且精细的策略，这是它实现高效编码的基础。它将帧内容划分成一个个相邻且大小相同的块，这些块被称作超级块，其大小有 128×128 或 64×64 像素两种规格，类似传统宏块的概念。超级块又能依据不同划分模式进一步细分为更小的块，其中四向拆分模式尤为特殊，它是唯一可递归细分其分区的模式，这就使得超级块能被拆分到最小为 4×4 像素的分区。

在实际应用中，分区模式会根据块大小而有所不同。例如，128×128 和 8×8 块不能使用 1：4 和 4：1 分割，8×8 块还不能使用 “T” 形分割。这种分区方式的优势在于，它能更灵活地适应视频内容的各种特征。对于大面积的平坦区域，使用较大的块进行编码，可以减少编码的复杂度；而对于纹理复杂、细节丰富的区域，将块划分得更小，能够更精确地捕捉图像细节，从而提高编码效率和视频质量。在编码风景视频时，对于广阔的天空部分，可以用较大的块来处理，而对于树木、岩石等细节多的部分，则采用较小的块进行精细编码。

（二）预测

AV1 在预测环节采用了一系列先进技术，大幅提升了预测的准确性和灵活性。在内部处理时，AV1 以更高的精度（每个样本 10 或 12 位）执行，这使得参考图像中的舍入误差更小，从而显著改善了压缩效果。在预测方式上，支持复合预测，能在一个块中以更高级的方式组合不同的预测方法，包括不同方向上平滑且尖锐的过渡渐变以及基于像素之间差异的隐式蒙版。这就允许在同一块中使用两个帧间预测，或者将帧间和帧内预测组合起来，大大提高了预测的适应性。

在帧内预测方面，AV1 的表现也十分出色。它在传统的帧内预测方向上进一步细化，提供了更多的预测方向。除了 8 种主要方向模式，对于较大的块，还能发出六个 3 度的偏移信号，三个在主角度之上，三个在主角度之下，总共可达 56 个角度，极大地增强了对不同纹理和边缘特征的适应能力。此外，还新增了递归滤波预测和跨分量预测，以及针对屏幕内容压缩性能优化的调色板模式和帧内块拷贝模式。对于包含大量文字和图形的屏幕内容视频，调色板模式可以通过使用少量独特的颜色来近似块，从而达到更好的压缩效果；帧内块拷贝模式则能利用帧内已有的相似块来进行预测，减少数据冗余。

（三）数据转换

为了将预测后剩余的误差转换到频域，AV1 编码器拥有丰富的变换选择。它不仅可以使用正方形，2：1/1：2 和 4：1/1：4 矩形 DCT（rect_tx），还能使用非对称 DST，甚至可以选择不进行任何变换（身份变换）。这种多样化的变换选择，使得 AV1 能够根据不同的视频内容和预测情况，选择最合适的变换方式，以达到最佳的编码效果。对于一些边缘信息丰富的视频区域，使用非对称 DST 可能会取得更好的变换效果，因为它对于处理具有特定边缘特征的块更为有效；而对于一些较为平滑的区域，正方形 DCT 或许就足够了。

AV1 还支持组合两个一维变换，即对水平和垂直维度（ext_tx）使用不同的变换。这种灵活的变换组合方式，进一步提升了 AV1 在处理复杂视频内容时的能力。在实际编码过程中，编码器可以根据块的特征，动态地选择水平和垂直方向上的变换类型，从而更好地利用视频内容的空间相关性，提高编码效率。这种数据转换方式的多样性和灵活性，是 AV1 在编码性能上超越传统编码标准的重要原因之一。

（四）量化

AV1 在量化方面引入了新的优化量化矩阵（aom_qm），这为其在保证视频质量的前提下实现更高的压缩比提供了有力支持。量化参数的选择和调整也更加灵活，现在可以针对每个帧，为两个色度平面设置各自的参数，并且支持使用空间预测。这意味着 AV1 能够根据视频内容的特点，对不同的帧以及帧内的不同区域，进行更加精准的量化处理。对于一些色彩丰富、细节较多的帧，可以适当调整量化参数，以保留更多的图像细节；而对于一些相对简单的帧，则可以采用更激进的量化策略，进一步减小数据量。

在每个新的超级块上，AV1 还可以通过发信号通知偏移来调整量化参数。这种动态调整量化参数的能力，使得 AV1 在编码过程中能够实时适应视频内容的变化。当视频场景发生快速切换时，AV1 可以迅速调整量化参数，确保在不同场景下都能保持良好的编码效果。这种精细的量化控制，不仅有助于提高压缩效率，还能在一定程度上提升视频的主观视觉质量，让观众在观看视频时感受到更清晰、更自然的画面。

（五）过滤器

在环路滤波步骤中，AV1 采用了 “约束方向增强滤波器”（cdef）。它是 Thor 的约束低通滤波器和 Daala 的定向去环滤波器集成的成果，性能超越了单独使用原始滤波器或两者一起使用的效果。这是一个边缘定向的条件替换滤波器，能够大致沿主导边缘的方向平滑具有可配置（信号化）强度的块，其主要作用是消除振铃伪影。振铃伪影通常出现在图像的边缘和纹理变化剧烈的区域，表现为围绕边缘的一系列明暗交替的条纹，会严重影响视频的视觉质量。

“约束方向增强滤波器” 通过对块进行有针对性的平滑处理，有效地减少了这种伪影的出现。在处理人物面部视频时，人物的面部轮廓和五官周围容易出现振铃伪影，使用该滤波器后，这些区域的伪影得到了明显抑制，人物面部看起来更加自然、清晰。它在保留物体边缘清晰度的同时，提升了重建图像的质量，为观众带来更优质的视觉体验。

五、AV1 的应用场景

（一）在线视频

在在线视频领域，AV1 的应用已经越来越广泛，成为了众多视频平台提升用户体验、降低运营成本的关键技术。

YouTube 作为全球最大的视频分享平台，早在 2018 年就开始支持 AV1 格式视频的播放。这一举措让用户在观看视频时享受到了更高的画质和更流畅的播放体验。由于 AV1 的高效压缩特性，相同画质的视频，文件大小相比传统编码格式大幅减小，这意味着在有限的网络带宽下，用户能够更快地加载和播放视频，减少了卡顿和缓冲的情况。对于 YouTube 来说，采用 AV1 编码后，服务器的存储成本和网络带宽成本也得到了有效控制。据统计，YouTube 在使用 AV1 编码后，视频存储所需的空间减少了约 30%，带宽成本降低了 20% 左右，这对于每天要处理海量视频数据的 YouTube 来说，是一笔相当可观的节省。

Netflix 作为全球知名的流媒体平台，也在积极推广 AV1 编码。2022 年，Netflix 开始向电视设备端正式使用 AV1 编码格式传输节目。Netflix 还推出了 “AV1 Film Grain Synthesis（FGS）” 技术，该技术利用 AV1 编码的优势，不仅在压缩视频文件体积、降低码率以及减少网络带宽需求方面取得显著成效，还能有效降低播放错误、缓冲时间和启动延迟，为用户带来更为稳定和流畅的观影体验。通过对源视频的细致分析，采用去噪处理后对比原视频来精确捕捉并估算出胶片颗粒的图案和形态，再根据不同场景的光线和色彩，智能调节颗粒的强度，最终将这一信息与经过压缩的无颗粒视频共同传输至终端设备，从而在播放时重现出理想的模拟胶片效果，让用户感受到更真实的电影质感。

国内的 B 站（哔哩哔哩）同样支持 AV1 编码格式，用户在观看视频时可以选择 AV1 编码，以获得更好的观看体验。随着 AV1 技术的不断发展和完善，相信会有越来越多的在线视频平台采用 AV1 编码，为用户带来更高质量的视频服务。

（二）OTT 服务

在 OTT（Over-The-Top）服务领域，AV1 同样展现出了巨大的应用潜力和优势。OTT 服务通过互联网向智能电视、机顶盒等终端设备提供视频、音频等多媒体内容，随着 4K、8K 超高清视频的普及，对视频编码的效率和质量提出了更高的要求。

AV1 的高效压缩特性使得它在 OTT 服务中具有明显的优势。在传输相同画质的视频时，AV1 编码的视频文件所需的带宽更低，这对于网络带宽有限的用户来说尤为重要。在一些网络条件不佳的地区，用户可以通过 AV1 编码的视频，在有限的带宽下流畅地观看高清视频，而不会出现卡顿的情况。对于 OTT 服务提供商来说，采用 AV1 编码可以降低内容传输的带宽成本，提高服务的稳定性和可靠性。

智能电视作为 OTT 服务的主要终端设备，对 AV1 的支持也在不断增加。越来越多的智能电视厂商开始在其产品中集成 AV1 硬件解码功能，使得用户可以直接在电视上流畅地播放 AV1 编码的视频。苹果新推出的 M3 芯片正式加入了 AV1 硬件解码的能力，使得搭载 M3 芯片的 Macbook Air 等设备能够流畅播放 8K AV1 超高清视频，也为智能电视等 OTT 设备的 AV1 解码提供了技术参考。这不仅提升了用户的观看体验，也推动了 AV1 在 OTT 服务中的广泛应用。随着 AV1 技术的不断成熟和智能电视硬件的不断升级，AV1 有望成为 OTT 服务中主流的视频编码格式，为用户带来更加优质的视听体验。

六、AV1 的发展现状与挑战

（一）硬件支持情况

在硬件支持方面，AV1 正逐渐获得越来越多厂商的青睐。2023 年，NVIDIA、Intel 和 AMD 等主要显卡厂商均已推出支持 AV1 硬件解码的产品。NVIDIA 的 RTX 40 系列显卡采用第八代英伟达视频编码器（NVENC），终于同时支持 AV1 硬件编码与解码。在此之前，RTX 30 系列仅支持 AV1 硬解码，而 RTX 40 系列补全了编码功能，这使得 NVIDIA 显卡在视频处理方面对 AV1 的支持更加全面。例如，GeForce RTX 4060 Ti 就带有一个第 8 代 NVENC 编码器和一个第 5 代 NVDEC 解码器，能够高效地进行 AV1 硬件编解码。

Intel 的锐炫系列显卡同样表现出色，锐炫 A380 GPU 是首款支持 AV1 编解码硬件加速的英特尔桌面级 GPU，其强大的 Xe 媒体引擎还内置了包括 H.265/HEVC、H.264/MPEG-4/AVC、VP9 等在内的广泛编解码器，叠加 AV1 可覆盖目前各类主流的视频编解码硬件加速需求。此外，英特尔还宣布其 A770 显卡正式支持 AV1 格式的硬件解码功能，这一功能在视频内容创作和播放领域具有重要意义，特别是在短视频平台的应用场景中，能够帮助用户以更低的带宽上传更高质量的视频。

AMD 的最新一代显卡也加入了对 AV1 的支持行列，为用户提供了更多的选择。在电脑平台上，目前绝大部分的独立显卡都已经支持 AV1 解码，甚至部分 CPU 核显都具备了不错的 AV1 硬解表现。苹果在其 M3 系列芯片中也加入了针对 AV1 的硬件解码，使得搭载 M3 芯片的 MacBook Pro 与 MacBook Air 能够轻松胜任基于 AV1 编码的 8K HDR 网络视频播放需求。随着这些硬件厂商的不断推动，未来支持 AV1 的硬件设备将会越来越多，为 AV1 的广泛应用提供更坚实的基础。

（二）面临的挑战

尽管 AV1 具有诸多优势，但在发展过程中也面临着不少挑战。从市场占有率来看，AV1 虽然在技术上表现出色，但由于推出时间相对较晚，目前的市场占有率还不高。H.264 作为应用最为广泛且成熟的视频编码标准，几乎所有的视频设备和平台都支持它，拥有庞大的用户基础和完善的生态系统。H.265 也已经在 4K、8K 高清视频、广播电视、视频监控等领域得到了广泛应用。AV1 要想在市场中占据更大的份额，还需要克服用户习惯和现有生态系统的阻碍，需要更多的时间和努力来推广和普及。

在软件解码方面，AV1 也面临着一些问题。AV1 编解码相对于较旧的标准（如 H.264）在计算上更为密集，这意味着在没有专门硬件加速的情况下，高分辨率 AV1 视频的播放可能会对 CPU 造成较大压力，影响播放性能。对于一些老旧设备或计算能力较低的设备来说，播放 AV1 编码的视频可能会出现卡顿、掉帧等情况，这在一定程度上限制了 AV1 的应用范围。虽然软件解码器在不断优化，像 dav1d 被认为是目前 “最好的” 软件 AV1 解码器，并且将进入 Android 设备，为移动平台带来更好的视频体验，但要完全解决软件解码的 CPU 负载问题，还需要进一步的技术突破和优化。

七、AV1 的未来展望

AV1 作为视频编码领域的后起之秀，展现出了巨大的潜力，有望在未来对视频行业产生深远的影响。

从技术发展的角度来看，随着硬件厂商对 AV1 支持的不断增加，以及软件解码器的持续优化，AV1 在解码性能上的短板将逐渐得到弥补。未来，AV1 可能会在更多的设备和平台上得到应用，成为视频编码的主流选择之一。随着人工智能技术的不断发展，AV1 编码可能会与 AI 技术相结合，进一步提升编码效率和视频质量。通过 AI 算法，可以更精准地分析视频内容，实现更智能的分区、预测和量化，从而在相同的带宽和存储条件下，提供更高质量的视频体验。

在市场应用方面，AV1 的开放和免费特性将吸引更多的开发者和内容创作者，促进视频行业的创新和发展。在线视频平台、OTT 服务提供商等将继续加大对 AV1 的应用和推广，降低运营成本，提升用户体验。AV1 还有望在视频监控、视频会议、虚拟现实等领域得到更广泛的应用。在视频监控领域，AV1 的高效压缩特性可以减少存储空间和传输带宽的需求，同时保证监控视频的清晰度和质量；在视频会议中，AV1 能够在有限的网络条件下，提供更流畅、高清的视频通话体验，提升远程沟通的效率和效果；在虚拟现实中，AV1 编码的视频可以让用户感受到更逼真、沉浸式的虚拟环境，推动虚拟现实技术的普及和应用。

AV1 作为一种具有创新性和潜力的视频编码技术，正处于快速发展的阶段。虽然目前面临着一些挑战，但随着技术的不断进步和市场的逐渐成熟，AV1 有望在未来的视频行业中发挥重要作用，为我们带来更高质量、更便捷的视频服务。让我们共同关注 AV1 的发展，期待它为视频行业带来更多的惊喜和变革。