性能度量
对学习器的泛化性能进行评估,不仅需要有效可行的实验估计方法,还需要有衡量模型繁华能力的评价标准,这就是性能度量。在给定样例集,其中
是示例
的真实标记,要评估学习器
的性能,就是要把学习器输出的结果
与真实标记
进行比较。
1. 均方误差
在回归任务中最常用的性能度量是“均方误差”:
本文介绍了机器学习中用于评估模型性能的各种度量标准,包括均方误差、错误率与精度、查全率与查准率、ROC曲线与AUC以及代价敏感错误率。通过对这些度量的理解,可以帮助在不同任务中选择合适的评价模型泛化能力的标准。
对学习器的泛化性能进行评估,不仅需要有效可行的实验估计方法,还需要有衡量模型繁华能力的评价标准,这就是性能度量。在给定样例集,其中
是示例
的真实标记,要评估学习器
的性能,就是要把学习器输出的结果
与真实标记
进行比较。
1. 均方误差
在回归任务中最常用的性能度量是“均方误差”:
860
430

被折叠的 条评论
为什么被折叠?