机器学习中的聚类、分类与模型验证
1. 聚类算法与手写数字识别应用
聚类算法能够为相关领域的专家提供样本间关系的线索。接下来,我们以手写数字识别这一光学字符识别问题为例,详细介绍相关的处理流程。
1.1 加载和可视化手写数字数据
我们使用 Scikit - Learn 的数据访问接口来加载手写数字数据,并进行初步的可视化。以下是具体的代码实现:
from sklearn.datasets import load_digits
digits = load_digits()
print(digits.images.shape) # 输出结果为 (1797, 8, 8),表示有 1797 个样本,每个样本是 8×8 的像素网格
import matplotlib.pyplot as plt
fig, axes = plt.subplots(10, 10, figsize=(8, 8),
subplot_kw={'xticks':[], 'yticks':[]},
gridspec_kw=dict(hspace=0.1, wspace=0.1))
for i, ax in enumerate(axes.flat):
ax.imshow(digits.images[i], cmap='binary', interpolation='nearest')
ax.text(0.05, 0.05, str(digits.target[i]),
transform=ax.t
超级会员免费看
订阅专栏 解锁全文
3047

被折叠的 条评论
为什么被折叠?



