模型评估是指对机器学习模型的性能进行评估和衡量的过程。通过模型评估,我们可以了解模型在处理新数据时的预测能力和泛化能力。以下是一些常见的模型评估指标和方法:
准确度(Accuracy):
准确度是衡量模型正确预测的样本数与总样本数之比。它是最常见的分类模型评估指标之一。
准确度 = (正确预测的样本数) / (总样本数)
精确度(Precision):
精确度是衡量模型预测为正类的样本中有多少是真正的正类。在二分类中,它可以通过以下公式计算:
精确度 = (真正的正类样本数) / (真正的正类样本数 + 假正类样本数)
精确度高表示模型能够准确地将正类标记为正类,但可能会忽略一些真正的正类。
召回率(Recall):
召回率是衡量真正的正类中有多少被模型正确预测为正类。在二分类中,它可以通过以下公式计算:
召回率 = (真正的正类样本数) / (真正的正类样本数 + 假负类样本数)
召回率高表示模型能够捕捉更多的正类,但可能会将一些负类错误地预测为正类。
F1Score
F1 = 2 x (精确率 x 召回率) / (精确率 + 召回率)
F1 分数会同时考虑精确率和召回率,以便计算新的分数。可将 F1 分数理解为精确率和召回率的加权平均值,其中 F1 分数的最佳值为 1、最差值为 0:
注意:实践中更加关注模型稳定性。