以下只针对语音的深度学习算法,
场景对比:
目前深度学习已经广泛应用于手机,voip,对讲机,TWS蓝牙耳机,算法也一步步完善,但是在个别场景还有待提升,总体效果比传统好得多,深度学习单麦克风可以跟传统双mic pk,还比其好,当然深度学习也有一定局限性,信噪比太低,效果也不行(比如-5dB以下,这时也得借助麦克风阵列才会比较好的效果),至于个别厂商3麦克风传统也有比较好的效果,总体传统算法+麦克风阵列还是有比较好的效果(这个是建立在多个麦克风基础上的)。
深度学习降噪一些场景不行(比如:蓝牙耳机在设备端做ai降噪,通讯对方传过来的声音降噪等),也是跟其训练语料有关,或者说这本来就是按一个标准去做的。
性能对比:
对于非平稳噪声快速抑制,效果优;传统2mic比较困难。要是只对比单mic传统根本没法比。
资源占用:
ai降噪对内存要求比较大(百kB级以上),功耗会多些(10M以上)
不足:
Ai就是一个黑盒子,如果ai降噪出现明显误压语音,只能靠炼丹师重新设置算法训练模型。
可以预见未来都是深度学习与传统降噪共存,麦克风阵列+ai越来越多。
至于ai回声消除还没有见那家厂商有商用的。
本文探讨了深度学习在语音降噪领域的应用,并与传统降噪技术进行了对比。指出深度学习在某些场景下表现更佳,尤其是在非平稳噪声快速抑制方面。然而,深度学习也存在局限性,如在极低信噪比环境中效果不佳。此外,文章还讨论了资源占用、应用场景及未来发展趋势。
874

被折叠的 条评论
为什么被折叠?



