12.【基础】手写体数字图像聚类--KMeans

最新推荐文章于 2024-09-21 10:15:00 发布

jho9o5

最新推荐文章于 2024-09-21 10:15:00 发布

阅读量4.6k

点赞数 2

CC 4.0 BY-SA版权

分类专栏：机器学习实战文章标签：机器学习 kmeans 手写体识别无监督学习

本文为博主原创文章，未经博主允许不得转载。

本文链接：https://blog.youkuaiyun.com/jh1137921986/article/details/79806829

本文探讨了使用KMeans进行手写体数字图像的无监督学习聚类，通过分析轮廓系数确定最佳模型为k=3。内容包括KMeans在手写体识别中的应用及其优势。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

本文所有实现代码均来自《Python机器学习及实战》

#-*- coding:utf-8 -*-

#分别导入numpy、matplotlib、pandas，用于数学运算、作图以及数据分析
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd 

#第一步：使用pandas读取训练数据和测试数据
digits_train = pd.read_csv('https://archive.ics.uci.edu/ml/machine-learning-databases/optdigits/optdigits.tra',header=None)
digits_test = pd.read_csv('https://archive.ics.uci.edu/ml/machine-learning-databases/optdigits/optdigits.tes',header=None)

#第二步：已知原始数据有65个特征值，前64个是像素特征，最后一个是每个图像样本的数字类别
#从训练集和测试集上都分离出64维度的像素特征和1维度的数字目标
X_train = digits_train[np.arange(64)]
y_train = digits_train[64]
X_test = digits_test[np.arange(64)]
y_test = digits_test[64]

#第三步：使用KMeans模型进行训练并预测
from sklearn.cluster import KMeans
kmeans = KMeans(n_clusters=10)
kmeans.fit(X_train)
kmeans_y_predict = kmeans.predict(X_test)

#第四步：评估KMeans模型的性能