WebRTC VoiceEngine综合应用示例（一）——基本结构分析

最新推荐文章于 2024-03-30 08:15:00 发布

zhanghui_cuc

最新推荐文章于 2024-03-30 08:15:00 发布

阅读量5.5k

点赞数 1

CC 4.0 BY-SA版权

本文链接：https://blog.youkuaiyun.com/nonmarking/article/details/50574733

音视频进阶之路专栏收录该内容

66 篇文章 ¥15.90 ¥99.00

订阅专栏

超级会员免费看

本文深入分析了WebRTC的VoiceEngine，从自底向上的角度探讨了其基本结构，包括核心API、音频编码器（如G722）、预处理（如回音消除、增益控制）以及与音频设备的交互。通过对AudioEncoder、AudioDecoder、EchoCancellation等组件的解析，揭示了VoiceEngine如何实现音频编解码、预处理和网络适应等功能。

把自己这两天学习VoiceEngine的成果分享出来，供大家参考，有什么问题也欢迎大家指出，一起学习一起进步。

本文将对VoiceEngine的基本结构做一个分析，分析的方法是自底向上的：看一个音频编码器是如何一层层被封装到VoiceEngine中的。

首先我们来看一下VoiceEngine的核心API，基本上就在webrtc\voiceengine\include的几个头文件中了。
具体来说，
voe_base
-支持G.711编码的、RTP传输的全双工VoIP应用，若要支持其他编码器，则需要VoECodec的支持
-初始化和销毁VoiceEngine实例
-通过文本或回调函数记录trace信息
-支持多channel（mixing或发送至多目标地址）

voe_codec
-支持其他编码器
-Voice Activity检测
-Possibility to specify how to map received payload types to codecs.

voe_dtmf
-Telephone event transmission.
-DTMF tone generation.

voe_errors
-错误信息

voe_external_media
-注册额外的音频处理功能

voe_file
-文件的播放、录制、转换

voe_hardware
-音频设备的操作
-设备信息
-CPU负载监控

voe_neteq_stats
-获取网络信息和音频解码信息

voe_n