PCA、PCoA、NMDS、Anosim学习

PCA、PCoA和NMDS是用于揭示样本间关系的排序分析方法,主要处理微生物群落结构的相似性和差异性。PCA通过线性变换和降维保留方差最大化;PCoA基于距离矩阵而非原始数据;NMDS则考虑进化信息。Anosim是一种非参数检验,用于判断样本分组差异是否显著。R值和P值帮助评估差异性和检验可靠性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

PCA,PcoA,NMDS分析都属于排序分析(Ordination analysis)。排序(ordination)的过程就是在一个可视化的低维空间或平面重新排列这些样本,使得样本之间的距离最大程度地反映出平面散点图内样本之间的关系信息(反映样本间菌群结构的相似性和差异性)。 通过比较样本点的距离,比较样本间的差异程度,样本间的距离越近表示样本组成的相似性越高,差异越小。

1、只使用物种组成数据的排序称作非限制性排序(unconstrained ordination)

    (1)主成分分析(principal components analysis,PCA)

    (2)对应分析(correspondence analysis, CA)

    (3)去趋势对应分析(Detrended correspondence analysis, DCA)

    (4)主坐标分析(principal coordinate analysis, PCoA)

    (5)非度量多维尺度分析(non-metric multi-dimensional scaling, NMDS)

2、同时使用物种和环境因子组成数据的排序叫作限制性排序(constrained ordination)

    (1)冗余分析(redundancy analysis,RDA)

    (2)典范对应分析(canonical correspondence analysis, CCA)

PCA(Principal Components Analysis)即主成分分析,也称主分量分析或主成分回归分析法,首先利用线性变换,将数据变换到一个新的坐标系统中;然后再利用降维的思想,使得任何数据投影的第一大方差在第一个坐标(

### PCA NMDS 的特点与应用场景 #### 主成分分析(PCA) 主成分分析是一种线性降维技术,其核心思想是通过寻找数据中的最大方差方向来降低维度。PCA 基于协方差矩阵或相关系数矩阵计算特征向量特征值,从而提取主要成分并减少冗余信息[^1]。 - **优点** - 计算效率高,适合处理大规模数据集。 - 结果易于解释,能够清晰展示变量间的线性关系。 - 对噪声具有一定的鲁棒性,在某些情况下能有效过滤掉次要变化因素。 - **局限性** - 只适用于线性可分的数据结构,无法捕捉复杂的非线性模式。 - 当样本间的关系并非欧几里得距离定义时,可能失去部分重要信息。 #### 非度量多维标度法(NMDSNMDS 是一种基于秩次的距离排序方法,旨在尽可能保留原始数据中对象之间的相对顺序而非绝对距离。这种方法特别适合用于描述生态学或其他领域内的复杂相似性或差异性矩阵[^3]。 - **优点** - 能够更好地适应非欧氏空间下的数据分析需求。 - 更灵活地应对不同类型的输入数据(如 Bray-Curtis 相似性指数),尤其在生物多样性研究中有广泛应用。 - 在面对大量物种或样品的情况下表现更优,因为它的优化过程专注于维持等级关系而不是精确数值匹配[^2]。 - **局限性** - 参数调整较为繁琐,通常需要多次迭代才能获得满意的结果。 - 解释起来相对较难,因为它并不像 PCA 那样提供明确的方向性贡献率指标。 #### 应用场景对比 - 如果目标是对连续型测量值进行简化表示,并希望了解哪些变量驱动了整体变异,则可以选择 PCA 方法。 - 若关注的是离散类别标签或者高度非线性的关联模式识别问题,则推荐采用 NMDS 技术[^4]。 ```python import numpy as np from sklearn.decomposition import PCA from scipy.stats import rankdata from skbio.stats.ordination import nmds # Example of using PCA and NMDS on a dataset X with shape (n_samples, n_features) pca = PCA(n_components=2) X_pca = pca.fit_transform(X) stress, X_nmds = nmds(rankdata(distance_matrix), number_of_dimensions=2) ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值