1. 前言
智能音箱的唤醒率和识别率除了受算法影响外,还跟音箱的音频信号质量直接相关。同样的算法库,音频信号质量越好,其唤醒率和识别率越高。根据工作经验,目前各厂家对智能音箱音频信号的判断标准,主要有以下几项:
- 时延稳定性
- 回声消除性能
- 相干性
- MIC阵列信噪比
- MIC阵列灵敏度
2. 信号质量标准
2.1 时延稳定性
定义:
时延(Delay),指音频各通道间接收同一信号的时间差。时延稳定性,指规定时间范围内,时延值保持稳定的能力。
解释:
在智能音箱领域,时延值通常指MIC信号和REF信号之间的时间差。当扬声器发出一个信号时,REF通道同时接收到该信号,该信号经空气传播至MIC孔处,MIC孔接收到该信号。由于扬声器和MIC有固定距离,所以MIC接收到该信号会晚于扬声器播放该信号,这个时间差就是时延。
影响:
时延稳定通常是由于电路丢数据或时钟波动导致。从算法角度讲,时延不稳定会影响算法收敛。时延值过大也会影响算法信号处理的效率。另,时延值不可能为负值,这是不科学的,因为不可能扬声器还未发出信号,MIC就收到了信号。
2.2 回声消除性能
定义:
回声消除(Acoustic Echo Cancellation,AEC),指输出信号从扬声器发出,经过空气传播,被设备本身的MIC接收,最后在MIC信号中减去该输出信号的过程。
解释:
MIC接收到的信号中,除了人声的唤醒音,还有设备本身播放的声音。对于算法来讲,人声唤醒音是想要得到的有效音,设备发出的声音是干扰音。回声消除就是将有效音从干扰音中剥离出来的过程。将干扰音消除后,算法才能正确识