低资源条件下印度语言语音识别与关键词检测研究
在当今信息时代,语音识别和关键词检测技术在人机交互等领域发挥着重要作用。然而,对于一些低资源语言,这些技术的发展面临着诸多挑战。本文将探讨针对低资源印度语言(如 Lambani 语和孟加拉语)的语音识别和关键词检测技术。
低资源语言语音识别系统综述
在低资源语言语音识别领域,许多研究者进行了相关探索。以下是一些研究成果的综述:
| 作者 | 语言 | 数据集 | 技术 | 性能 |
| — | — | — | — | — |
| Viet - Bac Le 等 | 越南语 | 训练 - 14 小时,测试 - 3 位说话者的 408 个句子 | 基于字形的声学模型;上下文相关的跨语言模型自适应 | SLER - 43.9%,WER - 50.6%;SLER - 36.6%,WER - 42.7% |
| Thomas S 等 | 英语 | 训练 - 15 小时德语、16 小时西班牙语、1 小时英语,测试 - 1.8 小时 | 30D 多流跨语言后验特征;DNN 特征 | 准确率 - 36.5%;WA - 41% |
| Imseng 等 | 南非荷兰语 | 训练 - 81 小时荷兰语、3 小时南非荷兰语,测试 - 50 分钟 | KL - HMM | PA - 68.8% |
| Tachbelie 等 | 阿姆哈拉语 | 训练 - 20 小时,测试 - 来自 ATC 120K 语料库的 5K 集 | 混合声学单元(音素和音节) | WER - 17.9% |
| Sahraeian 等 | 南非荷兰语 | 训练 - 10.7 小时,测试 - 2.2 小时 | 用于 SGMM 的固有频谱
超级会员免费看
订阅专栏 解锁全文
855

被折叠的 条评论
为什么被折叠?



