9、基于聚类分析的生物标志物研究：前列腺癌基因差异表达新方法

最新推荐文章于 2025-10-22 15:59:40 发布

lstm7chronicler

最新推荐文章于 2025-10-22 15:59:40 发布

阅读量37

点赞数

CC 4.0 BY-SA版权

分类专栏：生物信息学中的模式识别进展文章标签：聚类分析生物标志物前列腺癌

本文链接：https://blog.youkuaiyun.com/lstm7chronicler/article/details/149543102

生物信息学中的模式识别进展专栏收录该内容

38 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

基于聚类分析的生物标志物研究：前列腺癌基因差异表达新方法

基因识别的相关步骤

基因识别是整个研究的重要环节，主要基于相关分析展开。其具体步骤如下：
1. 计算后验概率与确定成员归属 ：为每个受试者 (i)（(i = 1, \ldots, N)）计算后验概率 ((\pi_{i1}, \ldots, \pi_{iC}))。通过 (\tau_{i} = \max(\pi_{i1}, \ldots, \pi_{iC})) 来确定受试者 (i) 的成员归属，当 (\tau_{i} \geq 0.6) 时，该受试者可归为某一集群；若 (\tau_{i} < 0.6)，则无法将其分配到 (C) 个集群中的任何一个。在这项研究中，仅考虑能明确确定至少 60% 受试者成员归属的基因，不满足此标准的基因被认为与疾病进展无关。
2. 构建列联表与进行卡方检验 ：基于聚类分析得到的成员指标和观察到的临床结果（复发或未复发），为每个基因构建列联表。随后对每个列联表进行卡方检验，以评估这两个变量之间的关联。若基因的 (p) 值小于预先选定的临界值（如 0.001，(p) 值从中心 (\chi^{2}) 分布计算得出），则认为该基因与观察结果有强关联，并将其选中。