- 博客(1)
- 资源 (7)
- 收藏
- 关注
原创 语音算法之语音分离
当前最优模型虽在实验室数据表现优异,但在真实场景(如车载环境、多人嘈杂餐厅)仍有显著性能落差。信号物理约束与深度学习黑箱的融合,以及计算效率与精度的平衡,仍是领域核心攻坚方向。语音分离的目标是将一个包含多个声源混合的音频信号,分解成其各个组成成分(源信号)的估计。3)语音和各种环境噪声(语音增强,可视为一种特殊的分离)2)人声(歌声或说话声)和伴奏音乐(人声/音乐分离)1)多个说话人的语音(多说话人分离)4)不同乐器的声音(音乐源分离)
2025-08-03 10:48:21
482
kaldi工具箱
kaldi工具箱,kaldi是一款语音识别工具库,由Daniel Povey进行开发和维护,整个框架比较成熟,在容纳经久不衰的GMM-HMM、SGMM-HMM、DNN-HMM等多种语音识别模型之外,还将现阶段比较“火”的DNN、CNN、LSTM、BLSTM等深度神经网络模型加入其中,获得了广大科研工作者和不少企业公司研发团队的青睐。
2018-03-10
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅