机器学习中的聚类、分类与模型验证
1. 聚类算法与手写数字识别应用
聚类算法能够为相关领域的专家提供样本间关系的线索。下面以手写数字识别这一光学字符识别问题为例,详细介绍相关操作。
1.1 加载和可视化手写数字数据
使用Scikit - Learn的数据访问接口加载手写数字数据:
from sklearn.datasets import load_digits
digits = load_digits()
print(digits.images.shape)
输出结果为 (1797, 8, 8) ,这表明图像数据是一个三维数组,包含1797个样本,每个样本由一个8×8的像素网格组成。
接下来可视化前100个样本:
import matplotlib.pyplot as plt
fig, axes = plt.subplots(10, 10, figsize=(8, 8),
subplot_kw={'xticks':[], 'yticks':[]},
gridspec_kw=dict(hspace=0.1, wspace=0.1))
for i, ax in enumerate(axes.flat):
ax.imshow(digits.images[i], cmap='binary', interpolation='near
超级会员免费看
订阅专栏 解锁全文
1万+

被折叠的 条评论
为什么被折叠?



