前言
我们知道机器学习分为回归问题和分类问题;同时,评价指标在模型训练和评价中占据着举足轻重的地位;本文主要介绍分类问题常见的四个评价指标,accuracy,precision, recall 和f1-score。在明确以上四个评价指标的定义和用途之前,我们需要知道四个概念;在二分类问题中,TP 是测试集上的样本为positive(正),我们的模型代入该测试集样本预测仍为正;TN 是测试集上的样本为negative(负),我们的模型代入该测试集样本预测仍为负;FP 是测试集上的样本为negative(负),我们的模型代入该测试集样本预测为正;FN 是测试集上的样本为positive(正),我们的模型代入该测试集样本仍为negative(负);我们接下来用这四个指标来引入accuracy,precision,recall,f1-score和ROC图的定义和用途。
一、accuracy
含义:在测试集上,预测对的样本占总样本的比例
公式:accuracy = (TP + TN)/(TP + TN + FP + FN)