无监督学习:PCA、K-means与自组织映射的探索
1. 主成分分析(PCA)在MNIST数据集上的应用
在处理图像数据时,由于图像尺寸较大且包含大量冗余数据,降维是十分必要的操作。以MNIST数据集为例,原始图像大小为28×28,通过主成分分析(PCA)可以将其降维到更小的尺寸。
1.1 PCA降维效果
对MNIST数据集使用PCA进行降维后,绘制散点图可以发现,相同颜色(即相同标签)对应的点聚集在一起,这表明PCA成功地对MNIST图像进行了降维。
1.2 TensorFlow嵌入API
TensorFlow提供了嵌入API,借助TensorBoard可以查找并可视化PCA和tSNE聚类。可以通过链接 http://projector.tensorflow.org 查看MNIST图像的实时PCA。
1.3 TensorBoard中的嵌入投影仪工具
TensorBoard中的嵌入投影仪工具包含三个面板,具体信息如下表所示:
| 面板名称 | 位置 | 功能 |
| ---- | ---- | ---- |
| 数据面板 | 左上角 | 可选择数据、标签等 |
| 投影面板 | 左下角 | 提供PCA、t - SNE和自定义三种投影类型选择 |
| 检查器面板 | 右侧 | 可搜索特定点并查看最近邻列表 |
PCA不仅是可视化数据集和发现变量间线性关系的有用工具,还可用于聚类、异常值检测和特征选
超级会员免费看
订阅专栏 解锁全文
409

被折叠的 条评论
为什么被折叠?



