印度语言识别与道路交通预测的深度学习技术研究
1. 印度语言识别技术分析
在印度语言识别领域,深度学习技术得到了广泛应用,但也面临着诸多挑战。
1.1 多语言深度学习声学建模的问题
多语言深度学习声学建模在印度语言识别中具有重要意义。然而,从单语上下文相关模型初始化会导致上下文相关状态的激增,语言自适应训练虽采用了学习隐藏单元贡献(LHUC)方法,但由于音素集不匹配导致上下文相关标签显著增加,给多语言和跨语言自动语音识别(ASR)带来了额外困难。
| 技术 | 意义 | 局限性 |
|---|---|---|
| 低资源印度东部和东北部语言的多语言语音语料库 | MFCC、SDC 和 RASTA - PLP 特征用于检测说话者和语言特定信息 | 低资源情况下训练数据不足 |
| 多语言 CapsNET 模型的细粒度语言识别 | 实时从嘈杂易获取数据源检测口语 | 胶囊网络在目标检测方面效果不佳 |
| LSTM - CTC 联合声学模型用于印度语言识别 | 增大门大小可降低关键曲线 | 受限区域不支持关键曲线 |
| 多语言场景文本检测和语言识别 | 生成文本提案并优化 |
超级会员免费看
订阅专栏 解锁全文
71

被折叠的 条评论
为什么被折叠?



