音视频开发_FFmpeg音视频编码-优快云博客

AAC（Advanced Audio Coding）是一种用于音频压缩和编码的标准，用于提高音频编码效率。AAC在保持音质的同时，压缩率比MP3更高，它使用更多的编码技术，包括MDCT（Modified Discrete Cosine Transform）和临时噪音形状编码等。

AAC音频编码的主要步骤如下：

以下是AAC编码的规格和它们的主要用途：

AAC-LC (Low Complexity Profile):
- 最常用的AAC profile。
- 广泛兼容、低处理复杂度且音质良好。
- 适合用于现代数字音频播放。
HE-AAC (High Efficiency AAC, aka AAC+):
- 增加了Spectral Band Replication (SBR)。
- 用于流媒体和广播，特别是在比特率较低时能够保持较好的音质。
HE-AAC v2 (aka eAAC+):
- HE-AAC的延伸，增加了Parametric Stereo (PS)。
- 针对单声道信号提供立体声编码，适合极度低比特率的应用。
AAC-LD (Low Delay AAC):
- 针对实时通讯设计，如视频会议。
- 低延迟，但比特率比AAC-LC高。
AAC-ELD (Enhanced Low Delay AAC):
- 结合了AAC-LD和SBR技术。
- 用于需要高质量和超低延迟的实时应用，如远程音乐表演。
MPEG 2 AAC-LC:
- MPEG 2标准中的AAC。
- 较为早期的AAC实现，和MPEG 4 AAC-LC相似。
MPEG 2 AAC-SSR (Scalable Sample Rate):
- 可伸缩采样率。
- 较少使用，主要在特定需要中实现。
MPEG 2 AAC-PS (Parametric Stereo):
- 并不是一个完整的profile，而是HE-AAC的一部分。
- 用于立体声信号的更高效编码。
MPEG 4 AAC-LTP (Long Term Prediction):
- 引入了长时预测编码。
- 被认为有较高的编码效率，但不如AAC-LC广泛支持。
MPEG 4 SLS (Scalable to Lossless):
- 也称为HD-AAC。
- 一种可伸缩的编码，可以从有损编码无缝过渡到无损编码。

AAC编码具有一系列重要的特点，使其成为多种应用场景中的首选音频压缩格式：

在AAC音频编码中，有两种广为人知的文件格式：ADIF（Audio Data Interchange Format）和ADTS（Audio Data Transport Stream）。这两种格式包含编码音频数据，但它们各有特点和用途。

AAC ADIF格式的文件的基本结构是由一个56字节的文件头和随后的音频帧数据组成的。下面是该文件头的详解：

adif_id: 这是一个32位（4字节）的字段，主要用于识别文件是不是ADIF格式。它的值通常是’ADIF’。
copy_id_present: 这是一个1位的字段，用于标识是否有额外的版权字段。如果设置为1，则后面会跟着一个72字节的版权信息。
home: 这是一个1位的字段，通常设置为0。
bitstream_type: 这是一个1位的字段，用于标识比特流是常量比特率（CBR）还是变量比特率（VBR）。0表示CBR，1表示VBR。
bitrate: 这是一个23位的字段，代表着比特流的比特率。
num_program_config_elements: 这是一个4位的字段，表示ADIF文件中的"program_config_element"的数量。通常这个值为0。
adif_buffer_fullness: 这是一个20位的字段，表示缓冲区的大小。