音视频会议,直播连麦以及短视频已经成为人们工作、教学以及娱乐的一部分,其背后都离不开音视频实时通信等关键技术的广泛应用。音频方面,可预见的是客户业务形式的多样性,环境的复杂性,以及接入设备的差异性会带来的一系列问题,我们意识到单一场景的技术与策略已经无法满足日趋暴露的线上问题,音频前处理 3A(AEC,ANS, AGC)算法走向全场景自适应才是唯一出路。为了解决复杂环境中的噪声问题,我们上线了 AliCloudDenoise - 语音增强算法,补强了传统降噪技术在非稳态噪声抑制方面的缺陷;为了解决音量问题,我们上线了 AliAGC - 自动增益控制算法,极大地改善了不同环境、设备、场景下音量不统一的问题,相比传统 WebRTC AGC 更加智能。
现有 WebRTC AGC 算法存在什么问题?
在《

本文介绍了阿里云针对音视频通信中的音量问题,尤其是WebRTCAGC算法存在的不足,如响应过激、增益估计不准确等。阿里云推出了AliAGC算法,实现了快速收敛、大增益范围、复杂场景稳定性和低功耗的目标,解决了音量不统一、嘈杂环境噪声放大、直播连麦音乐音量起伏等问题。通过数字增益自适应、模拟增益自适应和场景自适应方案,以及音频统计数据建设,显著提升了音频通信的质量和用户体验。
最低0.47元/天 解锁文章
624

被折叠的 条评论
为什么被折叠?



