1.机器学习之(4) Handwritten Digits Data Set初体验

最新推荐文章于 2022-11-09 22:53:56 发布

西安真的好热

最新推荐文章于 2022-11-09 22:53:56 发布

阅读量1.7k

点赞数 3

CC 4.0 BY-SA版权

分类专栏：机器学习文章标签： kNN 手写体识别 sklearn

本文链接：https://blog.youkuaiyun.com/xdzhangzhenhao/article/details/81147838

机器学习专栏收录该内容

5 篇文章

订阅专栏

本文通过使用sklearn库中的手写数字数据集，演示了如何加载数据、进行数据预处理，并应用k近邻(kNN)算法进行分类预测。通过可视化部分样本，读者可以直观了解数据特点。在划分训练集和测试集后，kNN模型达到了98.6%的准确率。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

载入数据

import numpy as np
import matplotlib 
import matplotlib.pyplot as plt
from sklearn import datasets
digits = datasets.load_digits()

得到数据集中的数据

X = digits.data
y = digits.target

可视化一下，二进制图像显示

随便选一个样本

some_digit = X[111]
some_digit_image = some_digit.reshape(8,8)
plt.imshow(some_digit_image, cmap = matplotlib.cm.binary)
plt.show()

y[111]

输出为4。

调用sklearn库

数据预处理

from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)

创建kNN模型并训练

from sklearn.neighbors import KNeighborsClassifier
kNN_classifier = KNeighborsClassifier(n_neighbors=3)
kNN_classifier.fit(X_train, y_train)

测试模型准确率

kNN_classifier.score(X_test,y_test)

输出

0.9861111111111112

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

西安真的好热

关注关注

3
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

Python数据可视化：十种方法实现图像数据集降维（实战篇—1）

不脱发的程序猿

04-15

3万+

本项目将依托于MNIST数据集，手把手实现图像数据集降维。

【python机器学习手册】第九章特征提取代码+笔记

weixin_48040339的博客

11-18

863

#9.1 from sklearn.preprocessing import StandardScaler from sklearn.decomposition import PCA from sklearn import datasets digits=datasets.load_digits() features=StandardScaler().fit_transform(digits.data) pca=PCA(n_components=0.99,whiten=True) features_pca=

参与评论您还未登录，请先登录后发表或查看评论

HandWritten_Digits

02-16

HandWritten_Digits

Dataset之Handwritten Digits：Handwritten Digits(手写数字图片识别)数据集简介、安装、使用方法之详细攻略

头部AI社区如有邀博主AI主题演讲请私信—心比天高，仗剑走天涯，保持热爱，奔赴向梦想！低调，专注，谦虚，自律，反思，成长，还算比较正能量的博主，公益免费传播…内心特别想在AI界做出一些可以推进历史进程影响力的技术(兴趣使然，有点小情怀，也有点使命感呀

02-28

1万+

Dataset之Handwritten Digits：Handwritten Digits(手写数字图片识别)数据集简介、安装、使用方法之详细攻略目录 Handwritten Digits数据集的简介 Handwritten Digits数据集的安装 Handwritten Digits数据集的使用方法 Handwritten Digit...

机器学习：准确率判定和超参数——handwritten digits dataset

chairon的博客

07-05

675

【代码】机器学习：准确率判定和超参数——handwritten digits dataset。

handwritten dataset手写体数据集(IAM,RIMES,CVL)

hxxjxw的博客

07-25

3857

IAM RIMES CVL

THE MNIST DATABASE of handwritten digits

eloudy的专栏

05-10

1534

http://yann.lecun.com/exdb/mnist/

机器学习：手写数字识别(Hand-written digits recognition)小项目

linwh8的博客

09-09

1万+

该项目的所有代码在我的github上，欢迎有兴趣的同学与我探讨研究~地址：Machine-Learning/machine-learning-ex3/1. Introduction 手写数字识别(Hand-written digits recognition)，顾名思义，就是将带有手写数字的图片输入到已经训练过的机器，且机器能够很快识别图片中的手写数字，并将之作为输出打印出来。实现原理：现以我个人

Coursera吴恩达机器学习课程总结笔记及作业代码——第4周神经网络

热门推荐

启人zhr的博客

05-02

2万+

Neural Networks1.1 Non-linear hypotheses在课程的开头，提到了非线性假设，会因为特征量的增多导致二次项数的剧增。举个例子，在图像识别中，一个50*50像素的图片，拥有的特征量为2500，那么它的二次项数为2500*2500/2,大约为3百万个。1.2 Model representation 上层是一个三层神经网络，第一层为输入层，第二层为隐藏层，第三层为

python查看数据集的维度、大小_Python机器学习（二十七）Sklearn 数据集基本信息...

weixin_42393315的博客

12-29

3827

前面章节中，我们加载了SciKit-Learn自带的数据集digits，可以通过以下语句查看数据集中包含哪些主要内容：digits.keys()输出dict_keys(['data', 'target', 'target_names', 'images', 'DESCR'])data样本数据target目标值target_names目标名称images图像格式(二维)的样本数据DESCR...

手写数字数据集

03-29

手写数字数据集，从http://yann.lecun.com/exdb/mnist下载整理

HandWritten_Character 手写字符-数据集

03-16

字母表（小和大写）数字和一些特殊字符 handwritten-characters_datasets.txt

MNIST handwritten digits

11-24

MNIST手写数字资源，已解压，不需要进一步操作，就是这样

Handwritten-Digit-Dataset:带有数据集生成器的107,730个28x28 PNG文件（从0到9的数字）的集合

03-27

手写数字数据集 集合了107,730个28x28 PNG文件（从0到9），用于机器学习。注意：这些图像不是来自MNIST，而是原始图像。它们是使用各种手写数字数据增强技术创建的。 数据集可以在找到，并在那里进行更新。您也可以下载。 数据集由10个文件夹组成，每个数字一个，数字被命名为“ <digit> <file> .png”，其中<digit>是它描述的数字，而<file>是一个数字范围。从0到the total number of files in the folder - 1 。创建自己的数据集 您可以创建自己的数据集，请注意，下载数据需要花费一些时间（对于29160个文件，大约需要15分钟，我发现重点放在标签上可以加快进度）。脚步：使用鼠标在屏幕中央的画布框绘制数字。单击带有您要绘制的相应数字的按钮。您可以单击“清除”按钮清除

Handwritten-dataset-master_MNIST数据集_

10-03

手写数字识别的经典案例实战，包含打包处理好了的数据集以及相关代码。

手写中文数据集

uncle_ll的博客

03-03

1万+

手写OCR数据集这里整理了常用手写数据集，持续更新中，欢迎各位小伙伴贡献数据集～中科院自动化研究所-手写中文数据集 华南理工大学-手写中文数据集 NIST手写单字数据集-英文中科院自动化研究所-手写中文数据集 数据来源：http://www.nlpr.ia.ac.cn/databases/handwriting/Download.html 数据简介：包含在线和离线两类手写数据，HWDB1.0~1.2总共有3895135个手写单字样本，分属7356类（7185个汉字和171个英文

MXNet官方文档中文版教程(7)：手写数字识别（Handwritten Digit Recognition）

青青韶华

10-30

6234

文档英文原版参见Handwritten Digit Recognition 在本教程中，我们将逐步介绍如何使用MNIST 数据集构建手写数字分类器。对于深度学习新手来说，这个练习可以说是和“Hello World”等同的。MNIST 是广泛使用的用于手写数字分类任务的数据集。它由70,000个有标记的，28x28分辨率的手写数字图像组成。数据集分为6万个训练图像和10,000个测试图像。共有10个

Handwritten Mathematical Expressions 手写数学表达式-数据集

03-10

如果您曾经不得不对数学表达式进行排版，您可能会想过：如果我可以给手写表达式拍照并自动识别它，那不是很好吗？该数据集包含构建系统所需的所有数据。该数据集融合了来自4个CROHME竞赛的数据集，提供了来自不同国家的数百位作家的11,000多种表达方式。 Handwritten Mathematical Expressions_datasets.txt

神经网络的手写数据集python实现

weixin_45856476的博客

11-09

1166

卷积神经网络实现手写数据集

origin练手数据

最新发布

03-26