26、自动语音识别中的机器学习技术:判别式训练与提升算法

自动语音识别中的机器学习技术:判别式训练与提升算法

在自动语音识别领域,为了提高识别的准确性和性能,研究人员探索了多种训练范式和算法。本文将深入介绍判别式训练和提升算法这两种重要的技术,包括它们的原理、实现方法以及在不同场景下的应用。

判别式训练

判别式训练是一种与分类规则直接相关的训练范式,旨在优化类别可分性。目前主要有以下几种方法:
- 最小分类错误(MCE)训练 :通过梯度下降方法直接最小化训练句子错误率的平滑函数。
- 最大互信息(MMI)训练 :目标是最大化声学观测与对应词序列之间的(经验)互信息,公式如下:
[F_{MMI}(\theta) = \sum_{i=1}^{N} \log \frac{p_{\theta}(x_i|y_i)}{\sum_{y} p_{\theta}(x_i|y)p(y)}]
- 最小音素错误(MPE)训练 :最小化正确转录与识别器输出之间的(期望)音素级Levenshtein距离。

判别式训练通过同时降低竞争假设生成观测声学特征的可能性,来优化类别可分性。然而,MMI训练的公式(4)需要在复杂的迭代过程中求解,每次迭代都需要对训练语料进行识别,这使得判别式训练框架非常复杂且耗时。为了简化计算,可以采用“纠正训练”(CT)算法,将分母限制为识别文本,但当训练误差非常低时,CT算法的改进效果有限。

为了克服CT算法的不足,提出了“竞争训练”(RT)算法。RT算法的目标是为小词汇量和孤立词识别任务提供一种判别式训练算法,其实现比基于格的判别式训练方法更简单,性能比CT算法更好。具体步

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值