基于聚类分析的生物标志物研究:前列腺癌基因差异表达新方法
基因识别的相关步骤
基因识别是整个研究的重要环节,主要基于相关分析展开。其具体步骤如下:
1. 计算后验概率与确定成员归属 :为每个受试者 (i)((i = 1, \ldots, N))计算后验概率 ((\pi_{i1}, \ldots, \pi_{iC}))。通过 (\tau_{i} = \max(\pi_{i1}, \ldots, \pi_{iC})) 来确定受试者 (i) 的成员归属,当 (\tau_{i} \geq 0.6) 时,该受试者可归为某一集群;若 (\tau_{i} < 0.6),则无法将其分配到 (C) 个集群中的任何一个。在这项研究中,仅考虑能明确确定至少 60% 受试者成员归属的基因,不满足此标准的基因被认为与疾病进展无关。
2. 构建列联表与进行卡方检验 :基于聚类分析得到的成员指标和观察到的临床结果(复发或未复发),为每个基因构建列联表。随后对每个列联表进行卡方检验,以评估这两个变量之间的关联。若基因的 (p) 值小于预先选定的临界值(如 0.001,(p) 值从中心 (\chi^{2}) 分布计算得出),则认为该基因与观察结果有强关联,并将其选中。
模拟研究
为了验证新方法的有效性,进行了两个模拟研究,每个研究包含 1000 个基因和 200 个受试者。
1. 第一个模拟研究
- 数据设置 :200 个受试者中,1 - 100 为未复发患者,101 - 200 为复发患者。随机为每个受试者生成三
超级会员免费看
订阅专栏 解锁全文
74

被折叠的 条评论
为什么被折叠?



