语音识别标准中WER和SER解释

本文详细介绍了语音识别领域中常用的评估标准,包括词错误率(WER)、句子识别错误率(SER)等,并通过实例说明了如何计算这些指标。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在语音识别中,常用的评估标准为词错误率WER,

WER计算方式为:为了使识别出来的词序列和标准的词序列之间保持一致,需要进行替换,删除,或者插入某些词,

这些插入,替换,删除的词的总个数,除以标准的词序列中词的个数的百分比,即为WER,其计算公式如下所示:


需要注意的是,因为有插入词,所以WER有可能大于100%,

例子:如下图所示:

第一行为标准的词序列,第二行为识别出来的词序列


那么上述的WER计算如下所示:

增加词3个,替换的词6个,删除的词1个,那么WER为:


在语音识别中,除了WER,还有句子识别错误率这个标准,即SER,SER表述为句子中如果有一个词识别错误,那么这个句子被认为识别错误,句子识别错误的的个数,除以总的句子个数即为SER

其计算公式如下所示:


除了WER,SER,还有字错误率,即CER,不是很常用就不介绍了。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值