前置知识
混淆矩阵(Confusion Matrix)
定义:展示分类模型预测结果的矩阵
| 预测正类 | 预测负类 | |
|---|---|---|
| 实际正类 | TP | FN |
| 实际负类 | FP | TN |
分类任务
准确率
定义:预测正确的样本数占总样本数的比例
公式:Accuracy = T P + T N T P + T N + F P + F N = \dfrac{TP+TN}{TP+TN+FP+FN} =TP+TN+FP+FNTP+TN
精确率
定义:预测为正类的样本中,实际为正类的比例
公式:Precision = T P T P + F P =\dfrac{TP}{TP+FP} =TP+FPTP
召回率
定义:实际为正类的样本中,预测为正类的比例
公式:Recall = T P T P + F N =\dfrac{TP}{TP+FN} =TP+FNTP
F1分数
定义:精确率和召回率的调和平均数
公式:F1 = 2 ∗ P r e c i s i o n ∗ R e c a l l P r e c i s i o n + R e c a l l =2*\dfrac{Precision*Recall}{Precision+Recall} =2∗Precision+RecallPrecision∗Recall
ROC-AOC
- ROC曲线 :以假正率(FPR)为横轴,真正率(TPR)为纵轴的曲线图。其中TPR即召回率,FPR即实际为负类的样本中,预测为正类的比例。
- AUC值 :曲线下面积(Area Under Curve),用于衡量模型整体区分能力。AUC=0.5:随机猜测;AUC=1:完美分类器
回归任务
均方误差
公式:MSE = 1 n ∑ i = 1 n ( y i − y ^ i ) 2 =\dfrac{1}{n}\sum\limits_{i=1}^{n}(y_i - \hat{y}_i)^2 =n1i=1∑n(yi−y^i)2
均方根误差
公式:RMSE = 1 n ∑ i = 1 n ( y i − y ^ i ) 2 =\sqrt{\dfrac{1}{n}\sum\limits_{i=1}^{n}(y_i - \hat{y}_i)^2} =n1i=1∑n(yi−y^i)2
1916

被折叠的 条评论
为什么被折叠?



