对模型性能进行评估（Machine Learning 研习十五）

甄齐才

于 2024-03-15 18:26:43 发布

阅读量1k

点赞数 19

CC 4.0 BY-SA版权

分类专栏：人工智能（AI）文章标签：机器学习人工智能深度学习召回率交叉验证混肴矩阵 Scikit-Learn

本文链接：https://blog.youkuaiyun.com/coco2d_x2014/article/details/136746997

文章探讨了如何使用交叉验证评估一个数字图像识别模型的准确性，指出单纯高准确率并不全面，强调了在处理偏斜数据集时需关注混淆矩阵和精确度/召回率权衡。作者演示了如何计算F1分数以及在不同应用场景中精度和召回率的重要性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在上一篇我们已然训练了一个用于对数字图像识别的模型，但我们目前还不知道该模型在识别数字图像效率如何？所以，本文将对该模型进行评估。

使用交叉验证衡量准确性

评估模型的一个好方法是使用交叉验证，让我们使用cross_val_score() 函数来评估我们的 SGDClassifier模型，使用三折的 k 折交叉验证。k-fold 交叉验证意味着将训练集分成 k 个折叠（在本例中是三个），然后训练模型 k 次，每次取出一个不同的折叠进行评估：

在这里插入图片描述

当您看到这组数字，是不是感到很兴奋？毕竟所有交叉验证折叠的准确率（预测准确率）均超过了 95%。然而，在您兴奋于这组数字前，还是让我们来看看一个假分类器，它只是将每张图片归入最常见的类别，在本例中就是负类别（即非 5）：

from sklearn.dummy import DummyClassifier

dummy_clf = DummyClassifier() 
dummy_clf.fit(X_train, y_train_5) 
print(any(dummy_clf.predict(X_train)))  # prints False: no 5s detected