三阴性乳腺癌社区与关键基因推断研究
1. 研究背景与方法概述
在三阴性乳腺癌的研究中,为了深入了解其分子机制,我们提出了一套识别显著社区和关键基因的框架。该框架主要基于收集到的综合数据集,运用了多个关键步骤和方法。
- 特征选择 :使用RPCA(Robust Principal Component Analysis)特征选择方法,从综合数据集中挑选出差异表达基因。通过对矩阵每行元素的处理得到评估向量$S_0$,其定义为:
$S_0 = \begin{bmatrix} \sum_{i=1}^{n}|s_{1i}| & \cdots & \sum_{i=1}^{n}|s_{mi}| \end{bmatrix}^T$
对$S_0$的值进行排序并进行曲线拟合,选择拐点值作为差异表达基因的数量。
- 网络构建与社区识别 :将挑选出的差异表达基因输入到WGCNA(Weighted Gene Co - expression Network Analysis)软件包中,用于构建网络和识别显著社区。
- 拓扑属性分析 :提出了一种新的拓扑属性NS(Normalized Score),结合了度中心性(DC)、介数中心性(BC)和接近中心性(CC),以更好地识别每个社区中的关键基因。
- 功能分析 :进行GO(Gene Ontology)富集分析和KEGG(Kyoto Encyclopedia of Genes and Genomes)通路富集分析,以检测可能参与三阴性乳腺癌进展的GO术语和通路。
超级会员免费看
订阅专栏 解锁全文
70

被折叠的 条评论
为什么被折叠?



