Matlab的主成分分析

主要目的

主成分分析(或称主分量分析,principal component analysis)由皮尔逊(Pearson,1901)首先引入,后来被霍特林(Hotelling,1933)发展了。 主成分分析的主要目的是希望用较少的变量去解释原来资料中的大部分变异,将 们手中许多相关性很高的变量转化成彼此相互独立或不相关的变量。通常是选出比原始变量个数少,能解释大部分资料中的变异的几个新变量,即所谓主成分,并用以解释资料的综合性指标。 因此,我们可以知道主成分分析的一般目的是: (1)变量的降维; (2)主成分的解释。

自己结合了一下写的

X=load('11.txt');
z=zscore(X);               %数据标准化
M=cov(z);                  %协方差
[Q,D]=schur(M);            %求出协方差矩阵的特征向量、特征根
d=diag(D);                %取出特征根矩阵列向量(提取出每一主成分的贡献率)
eig1=sort(d,'descend');      %将贡献率按从大到小元素排列
Q=fliplr(Q);                %依照D重新排列特征向量
B=z*Q;  %得到矩阵B;

S=0;
i=0;
while S/sum(eig1)<0.9
    i=i+1;
    S=S+eig1(i);
end                         %求出累积贡献率大于90%的主成分
NEW=z*Q(:,1:i);              %输出产生的新坐标下的数据
W=100*eig1/sum(eig1);      %贡献率
figure(1)
pareto
### 主成分分析(PCA)原理 主成分分析(Principal Component Analysis, PCA)是一种用于降维的技术,旨在通过线性变换将一组可能存在相关性的变量转换成一组线性不相关的变量。这些新的变量被称为“主成分”,它们按照方差大小依次排列,即第一个主成分具有最大可能的方差,而后续每一个主成分都在与之前所有主成分正交的方向上拥有最大的剩余方差[^1]。 #### 数学基础 具体来说,在执行PCA时会涉及到协方差矩阵计算以及特征向量求解两个重要环节: - **协方差矩阵**:用来衡量各个维度之间的关系强度; - **特征分解**:对上述得到的协方差矩阵做特征值和对应的单位化后的特征向量求取工作;其中特征值表示该方向上的数据分布宽度或者说离散程度,而特征向量则指示了这个最宽处的具体方位角。 对于给定的数据集X (m×n),其中m代表样本数量,n为属性数目,则可以通过如下方式完成一次完整的PCA过程: ```python import numpy as np from sklearn.decomposition import PCA def perform_pca(X, n_components=2): pca = PCA(n_components=n_components) principalComponents = pca.fit_transform(X) explained_variance_ratio = pca.explained_variance_ratio_ return principalComponents, explained_variance_ratio ``` 这段Python代码展示了如何利用`sklearn`库中的PCA模块来简化实际操作流程,并返回前两维的主要组成部分及其解释比例。 ### 应用场景 PCA的应用非常广泛,不仅限于特定行业或学科领域。以下是几个典型例子: - **图像处理**:可用于人脸检测、手写字符识别等领域内的预处理阶段,减少冗余信息的同时保持关键特性不变。 - **生物医学工程**:帮助研究人员更好地理解基因表达模式的变化规律,支持疾病诊断模型构建等工作[^3]。 - **金融建模**:有助于发现资产价格变动背后隐藏的风险因子结构,辅助投资组合优化决策制定等业务活动。 - **市场营销调研**:可以揭示消费者偏好背后的潜在因素构成情况,为企业产品定位提供科学依据。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值