【聚类】ConsensusClusterPlus包

ConsensusClusterPlus是R语言中用于consensus clustering的工具,适用于基因表达数据。主要步骤包括数据准备、聚类和计算共识。输入数据要求是标准化表达矩阵,常用MAD衡量的高变基因进行分析。关键参数如pItem、pFeature、maxK、reps等可调整。聚类结果可用于分析生物学过程,如血管生成、缺氧研究,或结合免疫浸润分析。该方法在共表达网络研究中可能更具优势。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

ConsensusClusterPlus包是R语言中实现consensus clustering的一种方法。

主要有三个步骤:1,准备输入数据;2,跑流程;3,generating consensus

  • 1-输入数据

输入数据要求无特别,列为样本行为基因、标准化的表达矩阵。

值得注意的是,此包默认选择以median absolute deviation (MAD)衡量的top5000高变基因用于分析,以更好的聚类分群(这和单细胞很像)。选择多少基因和选择方法都是可以自己选择的,因为这步骤用的classical R statistics而非包中的集成化命令。

library(ALL)
data(ALL)
d=exprs(ALL)
d[1:5,1:5]

mads=apply(d,1,mad)
d=d[rev(order(mads))[1:5000],]
d = sweep(d,1, apply(d,1,median,na.rm=T))

  • 2-聚类

几个重要参数:

pItem: percent of items (column) resampling

pFeature: percent of features (rows) resampling

maxK: maxium cluster counts

reps: resampling times

clusterAlg: agglomerative hierarchical clustering algorithm

distance: 1- Pearson correlation distances<

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值