如何确定PCA降维的维度

最新推荐文章于 2024-09-05 22:56:47 发布

洛阳山

最新推荐文章于 2024-09-05 22:56:47 发布

阅读量2.2k

点赞数 1

分类专栏：机器学习文章标签：机器学习

本文链接：https://blog.youkuaiyun.com/u012949658/article/details/117295311

版权

机器学习专栏收录该内容

13 篇文章

订阅专栏

本文介绍了PCA（主成分分析）的基本思想，通过周志华老师的《机器学习》中的相关知识，阐述PCA如何将高维数据映射到低维空间，同时保持数据的主要特征。使用sklearn库实现PCA，通过设置阈值确定降维的维度，并提供了代码示例。文章还提供了PCA的补充学习资源。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

主要是对西瓜书里面的一个思路的实现，并不涉及PCA原理和公式推导，用一句话总结PCA，在 $R^{d}$ 中的m个点经过矩阵变换（压缩）映射到 $R^{d'}$ 空间中，并且保证 $d^{'} < d$ ，其中 $d^{'}$ 是新维度。

用矩阵表示： $Z_{d'*m}=W^{T}_{d'*d} * X_{d*m}$
其中下标是矩阵行列数，和现实里面刚好反过来；Z是样本转换后的矩阵，X是样本最初的矩阵，W是转换（投影）矩阵。

文章目录

一、思路

在这里插入图片描述
周志华老师《机器学习》P231

二、代码实现

主要是通过sklearn实现，比较简单

def get_pca(X,threshold):
    pca=PCA()
    pca.fit(X)
    variance_ratio=pca.explained_variance_ratio_
    s=0
    for i in range(len(variance_ratio)):
        s=s+variance_ratio[i]
        if s>=threshold:
            break
    new_dim=i+1
    components=pca.components_
    change_matrix=components[0:new_dim,:]
    norm_X=X-np.mean(X,axis=0)
    X_pca=np.matmul(norm_X,change_matrix.T)

    return X_pca