欢迎关注微信公众号《生信修炼手册》!
识别到与表型数据相关的modules之后,还可以在该modules中进一步筛选基因,为了方便筛选,对于每个基因定义了以下三个统计量
1. connectivity
连接度,在之前的文章中,简单提过这个概念,类似于网络中节点的degree
的概念,只不过在加权共表达网络中,由于每条边代表两个基因间的相关性的大小,对应一个数值,所以一个基因在共表达网络中的连接度定义为与该基因相连的所有边的数值之和。
另外,根据相连的基因是否和该基因位于同一个module, 又可以将边分为两类,和该基因位于同一个module内,定义为within, 位于不同的modules, 定义为out。在WGCNA中,可以通过intramodularConnectivity
函数计算连接度,用法如下
# 计算基因间的邻接值
ADJ1=abs(cor(datExpr,use="p"))^6
# colorh1代表module的颜色
Alldegrees1=intramodularConnectivity(ADJ1, colorh1)
计算的结果如下
> head(Alldegrees1)
kTotal kWithin kOut kDiff
Gene1 31.80186 28.37595 3.425906 24.95005
Gene2 28.88249 26.47896 2.403522 24.07544
Gene3 25.38600 23.11852 2.267486 20.85103
KTotal
代表该基因的所有边的连接度,KWithin
代表和该基因位于同一个module下的边的连接度,KOut
代表和该基因位于不同module下的边的