运用mnist实现手写数字的评估模型_mnist数据测试模型精度-优快云博客

本文链接：https://blog.youkuaiyun.com/monk96/article/details/125523493

本文介绍了使用sklearn库进行多分类任务的数据处理，包括加载MNIST数据集，划分训练集和测试集。接着，通过K近邻算法训练模型，并展示了如何评估模型性能，如混淆矩阵、交叉验证、精度、查全率和F1分数。这些评估指标对于理解模型在分类任务中的表现至关重要。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

文章目录

数据处理
划分数据集为训练集和测试集
训练模型
评估模型
f1_score

数据处理

import numpy as np
import pandas as pds
from sklearn import datasets
mnist = datasets.load_digits()
images = mnist.images
data, labels = mnist.data, mnist.target

查看图片

import matplotlib.pyplot as plt
plt.imshow(images[0])

在这里插入图片描述

划分数据集为训练集和测试集

运用 sklearn 的方法

from sklearn.model_selection import train_test_split
images = images.reshape((1797, -1))
train_x, test_x, train_y, test_y = train_test_split(images, labels, test_size=0.2)

训练模型

这里用了k邻算法进行数据分类

from sklearn.neighbors import KNeighborsClassifier
kn_clf = KNeighborsClassifier(10)
model = kn_clf.fit(train_x, train_y)

评估模型

混淆矩阵

在这里插入图片描述

大概是这样的一个计算方式

from sklearn.metrics import confusion_matrix
confusion_matrix(train_y, model.predict(train_x))

在这里插入图片描述

交叉验证


from sklearn.model_selection import cross_val_score
cross_val_score(kn_clf, train_x, train_y, cv=3)

在这里插入图片描述

精度和查全率

关于精度和查全率，可以查看我上一篇文章。
p1 = TP/TP + FP p2 = TP/TP + FN

from sklearn.metrics import recall_score, accuracy_score
print(accuracy_score(train_y, model.predict(train_x)))
recall_score(train_y, model.predict(train_x), average ="micro")

在这里插入图片描述

f1_score

x-u/std

这将会平均每个数字的权重，平时越大的数影响越大，现在大的和小的都被归属到0-1之间或特定数值间。
比如：平时10000， 100， 20，对于10000的影响明显要更大，而现在10000- 8778/10000 范围也在0-1内，降低了大的数值影响的权重，而小数字不变。

from sklearn.metrics import f1_score
f1_score(train_y, model.predict(train_x),  average ="micro")

在这里插入图片描述
以上，就是目前学习到的多分类的评估方法。