超低复杂度残回声与噪声抑制及半端到端嵌套命名实体识别技术
在语音处理和信息提取领域,超低复杂度残回声与噪声抑制以及命名实体识别(NER)是两个重要的研究方向。下面将分别介绍相关的技术和方法。
超低复杂度残回声与噪声抑制
在回声和噪声抑制方面,研究人员致力于设计超低复杂度的残回声抑制(RES)网络,以满足高效声学回声消除(AEC)系统的需求。
代码执行与实时因子
非向量化的 C/C++ 代码在 Intel(R) Core(TM) i5 - 10210U CPU@1.60 GHz 上执行,实时因子(RTF)为 0.014(包括 FFT/IFFTs 和网络推理)。而向量化(X86 SSE2 Intrinsics)代码的 RTF 降低至 0.008,这使得它能够在从低到高配置的 PC 或移动设备上流畅运行。
性能评估
- AECMOS 得分 :在单讲和双讲场景下,图 2(c) 所示拓扑结构的 RES 模型的 AECMOS 得分优于基线模型,且标准差最小,性能更稳定,因此被用作后续比较的默认模型。
- ERLE :在远端单讲场景中,该模型的回声返回损耗增强(ERLE)为 60.07dB,显著高于基线模型,且标准差相近。
- STOI :在双讲场景中,使用 AEC Challenge 2022 合成近端语音语料库中的随机话语作为干净语音,与麦克风信号混合,模拟不同信号回声比(SER)的双讲场景。结果表明,RES 模型的短时客观可懂度指数(STOI)值与基线模型相近
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



