深度学习在语音验证与肺部疾病检测中的应用
1. 多传感器下的说话人验证深度学习框架
1.1 时域方程推导
对式 3 进行逆傅里叶变换,可得到如下时域方程:
[g[n, ν_1, ν_2] = 2ν_2\mathrm{sinc}(2\piν_2n) - 2ν_1\mathrm{sinc}(2\piν_1n)]
为确保较低截止频率(ν_1)大于零,且较高截止频率(ν_2)大于较低截止频率,定义边界如下:
[ν_{abs1} = |ν_1|]
[ν_{abs2} = ν_1 + |ν_2 - ν_1|]
这里,这些截止频率由神经网络进行训练,以获得高效的滤波器。(\mathrm{rect}(.))定义为矩形函数,在频域中产生矩形脉冲。通过将窗口函数与确定的函数(g)相乘来进行加窗操作。将参考函数(g)与汉明窗口相乘,得到最终滤波器。汉明窗口函数如下:
[w_{ham}[l] = 0.54 - 0.46 \cos(\frac{2\pi l}{L})]
在式 8 中,将窗口函数与 sincnet 滤波器相乘:
[g_w[n, ν_1, ν_2] = g[n, ν_1, ν_2] \cdot w_{ham}[n]]
1.2 标准 CNN 块
在 Sinc - Net 中,sinc 函数由一组低通和高通滤波器进行参数化,这些滤波器表示为一组权重,通过网络使用反向传播和梯度下降进行优化。在训练期间,根据模型预测值与真实值之间的偏差更新滤波器的权重。误差在网络中反向传播,根据误差相对于权重的梯度再次更新权重。这个过程会重复进行,直到模型收敛到一个令人满意的解。该网络使用 Adam 优化器,这
超级会员免费看
订阅专栏 解锁全文
1075

被折叠的 条评论
为什么被折叠?



