文章目录
一、 准确性指标 (Accuracy Metrics)
1. 词错误率 (Word Error Rate, WER)
这是最常用、最核心的语音识别准确率评价指标。
- 计算原理:WER 通过计算识别结果(Hypothesis)和标准参考答案(Reference)之间的编辑距离来衡量。编辑距离是指将识别结果的词序列转换为参考答案的词序列所需的最少替换(Substitution)、插入(Insertion)、删除(Deletion)操作的次数。
- 计算公式:
WER = (S + D + I) / N
-
S (Substitutions): 替换错误的数量。例如,参考是“今天天气”,识别为“今天暖气”,这里“天”被替换为“暖”,S=1。
-
D (Deletions): 删除错误的数量。例如,参考是“今天天气”,识别为“今天气”,漏了“天”,D=1。
-
I (Insertions): 插入错误的数量。例如,参考是“今天天气”,识别为“今天的天气”,多了一个“的”,I=1。
-
N: 参考答案中的总词数。
-
特点:
- WER 的值可以**超过 100%**(如果错误非常多

最低0.47元/天 解锁文章
1267

被折叠的 条评论
为什么被折叠?



