机器学习 day01(四)

最新推荐文章于 2023-05-06 17:54:04 发布

原创最新推荐文章于 2023-05-06 17:54:04 发布 · 485 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

Python 机器学习专栏收录该内容

24 篇文章

订阅专栏

本文介绍了一种基于机器学习的手写数字识别方法，包括图片预处理、数据集划分、模型训练及参数调优过程。通过将图片转换为784维特征向量，利用sklearn算法实现数字识别，并通过网格搜索提升模型精度。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

手写体数字识别

与ipynb文件夹同级的data文件夹下有10个文件,
在这里插入图片描述
每个文件中都是手写体数字的图片

1. 导入绘图模块,查看图片

先读取一张图片,图片为28x28像素
在这里插入图片描述

2. 读取文件所有的手写体数字图片

这是一个三维数组,总共有5000张图片
在这里插入图片描述

3. 模型训练

3.1 sklearn的算法只接受二维以下的数组

所以不能直接训练
在这里插入图片描述

3.2 使用reshape()函数将数组由三维变成二维

data是一个5000x28x28的三维数组，5000代表有5000张图片，属于数据的样本量，28x28代表每一个样本，样本比价特别，是图片，样本的特征就是图片的每一个像素，这些像素现在排列成了一个28x28的方阵，我们可以把这方阵改成一个784的行向量
在这里插入图片描述

3.3 切分训练集合测试集

在这里插入图片描述

4. 算法参数调优

4.1 用网格搜索进行参数的调优

由于计算机性能有限,没办法对参数进行全调,将64参数个随机打乱,取随机打乱的前20个参数随机调优

在这里插入图片描述

4.2 训练调优

在这里插入图片描述

4.3 查看相关信息

在这里插入图片描述

4.4 预测

预测标签,可以看到预测标签有1000条数据,简单对比一些测试标签和预测标签,数据太多,不一一查看
在这里插入图片描述

5. 算法打包

在这里插入图片描述

6. 用图像来画出x_test其中前100条数据的图像，以及其预测情况和真实情况

在这里插入图片描述
查看预测和真实情况

还是有数据会识别出错的,这是必然的

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。