1.ROC曲线和PR曲线是什么?
ROC曲线和PR曲线是用来评估机器学习算法性能的重要指标。
举一个例子:当分类算法在过滤垃圾邮件时,会有四种结果:对合法邮件保留,也可能产生失误,过滤了合法邮件;还有可能保留了一些垃圾邮件,最后就是正确过滤了垃圾邮件。
在机器学习中,有一个普遍适用的称为混淆矩阵(confusion matrix)的工具,它可以帮助人们更好地了解分类中的错误。
预测结果 | |||
+1 | -1 | ||
真实结果 | +1 | 真正例(TP) | 伪反例(FN) |
-1 | 伪证例(FP) | 真反例(TN) |