周志华《机器学习》(西瓜书)目录
https://editor.youkuaiyun.com/md?articleId=106864771
—————————————————————————————————
性能度量
对学习器的泛化性能进行评估,不仅需要有效可行的实验估计方法,还需 要有衡量模型泛化能力的评价标准,这就是性能度量(performance measure).
- 错误率与精度
- 查准率、查全率与F1
- ROC 与 AUC
- 代价敏感错误率与代价曲线
数据集:
学习器:f
回归任务最常用的性能度量是"均方误差" (mean squared error)。

对于一般的数据分布D以及概率密度函数p(.),均方误差为:

错误率与精度
错误率是分类错误的样本数占样本总数的比例。
精度则是分类正确的样本数占样本总数的比例。


对于一般的数据分布D以及概率密度函数p(.),其表示为:


查准率、查全率与F1
对于二分类问题,真实类别和机器预测类别的组合如下:


最低0.47元/天 解锁文章
764

被折叠的 条评论
为什么被折叠?



