ML之DR之PCA：利用PCA对手写数字图片识别数据集进行降维处理(理解PCA)

最新推荐文章于 2022-05-16 10:30:53 发布

一个处女座的程序猿

最新推荐文章于 2022-05-16 10:30:53 发布

阅读量7.6k

点赞数 7

CC 4.0 BY-SA版权

分类专栏： ML

本文链接：https://blog.youkuaiyun.com/qq_41185868/article/details/88078288

ML 专栏收录该内容

535 篇文章

订阅专栏

本文通过手写数字图片识别数据集，深入浅出地讲解了主成分分析(PCA)的原理及其实现过程，展示了如何使用PCA进行数据降维，并通过可视化结果直观展现PCA的效果。

ML之DR之PCA：利用PCA对手写数字图片识别数据集进行降维处理(理解PCA)

初步理解PCA

输出结果

核心代码

初步理解PCA

#理解PCA：线性相关矩阵秩计算样例

import numpy as np

M = np.array([[1, 2], [1009, 2018]])      #初始化一个2*2的线性相关矩阵
result=np.linalg.matrix_rank(M, tol=None) #计算2*2线性相关矩阵的秩
print('得出矩阵的秩：',result)

输出结果

利用PCA对手写数字图片识别数据集进行降维处理

核心代码


X_digits = digits_train[np.arange(64)]
y_digits = digits_train[64]

estimator = PCA(n_components=2)
X_pca = estimator.fit_transform(X_digits)

    for i in range(len(colors)):
        px = X_pca[:, 0][y_digits.as_matrix() == i]
        py = X_pca[:, 1][y_digits.as_matrix()== i]
        plt.scatter(px, py, c=colors[i])
    
    plt.legend(np.arange(0,10).astype(str))
    plt.xlabel('First Principal Component')
    plt.ylabel('Second Principal Component')

关注博主即可阅读全文