混淆矩阵
对于一个二分类问题,即正类(positive)或负类(negative),则会出现以下四种情况:
TP(True Positive ,真正类):
若一个实例是正类,并且被预测为正类
FN(False Negative ,假负类)
若一个实例是正类,但是被预测为负类
FP(False Positive ,假正类)
若一个实例是负类,但是被预测为正类
TN(True Negative ,真负类)
若一个实例是负类,并且被预测为负类
准确率(Accuracy)
二分类:预测正确的样本数量占总量的百分比:(准确率在样本不均衡情况下,不能评价模型性能的优劣)
多分类:
精准率(Precision)、阳性预测值(Positive Predictive Value,PPV)
指预测的正类中有多少为真的正类。即当模型声称事件发生时,事件真正发生的比例
召回率(Recall)、真阳率(True Positive Rate,TPR)、敏感度(Sensitivity)
指所有正类中有多少被预测为正。即当事件真正发生时,模型成功预测它发生的比例
F1 Score
指精准率和召回率的调和平均数,最大为1,最小为0
均方误差(Mean Square Error,MSE)
测量预测值Ŷ
与某些真实值匹配程度。MSE 通常用作回归问题的损失函数
绝对平均误差(Mean Absolute Error,MAE)
指模型预测值Ŷ
与样本真实值 y 之间距离的平均值