语音活动检测与声门生物特征签名估计研究
高效语音活动检测(VAD)
在语音识别等领域,语音活动检测(VAD)起着重要作用。有一种基于广义高斯概率密度函数(PDF)的高效VAD方法表现出色。通过对ROC曲线的分析发现,二阶和三阶模型能显著降低分类误差。在相同条件下,该VAD方法在语音/非语音检测性能方面,优于Sohn的VAD以及标准化的G.729、AMR和AFE VAD等其他近期报道的VAD方法。
当N = 2时,MCO - LRT可表示为:
[
\ell_{l,2} = \sum_{\omega} \ln \frac{K_{H_1,2}}{K_{H_0,2}} + \frac{1}{2} \hat{y} {\omega}^T \Delta {\omega}^2 \hat{y} {\omega}
]
其中:
[
\ln \frac{K {H_1,2}}{K_{H_0,2}} = \frac{1}{2} \ln \left(\frac{|C_{N_{y_{\omega},H_0}}|}{|C_{N_{y_{\omega},H_1}}|}\right) = \frac{1}{2} \left(\frac{\sigma_{H_0}^1 \sigma_{H_0}^2 - (r_{H_0}^1)^2}{\sigma_{H_1}^1 \sigma_{H_1}^2 - (r_{H_1}^1)^2}\right)
]
若假设语音信号是在加性独立噪声中观测到的,即对于i = 1, 2:
[
H_1: \sigma_{H_1}^i = \sigma_{n}^i + \sigma_
超级会员免费看
订阅专栏 解锁全文
16

被折叠的 条评论
为什么被折叠?



