模型评估：Python项目实战中的错误率与泛化能力分析-优快云博客

本文链接：https://blog.youkuaiyun.com/qq_51946537/article/details/125132128

本文探讨了在Python项目实训中，模型评估的方法和指标，重点关注错误率（WER）的计算，并分析了如何忽略手写体影响以评估模型的泛化能力。通过使用CROHME数据集，模型在印刷体和手写体公式上的表现被详细比较，结果显示模型在序列长度增加时保持了较好的泛化能力，但整体正确率会受到公式长度和二义性符号的影响。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

模型评估

常用的评估指标

错误率可以按照如下公式计算：
$R=\frac{N_{\text {sub }}^{W}+N_{d e l}^{W}+N_{i n s}^{W}}{N^{W}}=\frac{N_{\text {sub }}^{W}+N_{d e l}^{W}+N_{i n s}^{W}}{N_{\text {sub }}^{W}+N_{d e l}^{W}+N_{\text {cor }}^{W}}$
其中：
$N_{\text {sub }}^{W}$ 符号替换的数量
$N_{\text {del}}^{W}$ 符号缺少的数量
$N_{\text {ins }}^{W}$ 符号插入的数量
$N_{\text {col }}^{W}$ 符号正确的数量
$N^{W}$ 目标生成的符号数量