癌症样本聚类与特征选择及乙肝病毒感染相关基因研究
在生物医学研究领域,癌症样本的聚类和特征选择以及乙肝病毒感染与基因的关联研究具有重要意义。下面将为大家详细介绍相关的研究方法和成果。
1. HRNMF方法在癌症样本聚类和特征选择中的应用
在基因表达数据分析中,基于L1/2 - RNMF衍生出了GrRNMF和HRNMF方法。由于四个基因表达数据集较大,存在噪声和流形结构,而HRNMF在目标函数中集成了超图正则化和L2,1 - 范数,使其性能优于其他方法。与GrRNMF相比,HRNMF在四个基因表达数据集上分别提高了3.03%、5.48%、5.39%和3.18%。与L1/2 - RNMF相比,HRNMF平均提高了18.8%;与GrRNMF相比,平均提高了4.34%。
为了进一步分析基因特征,研究人员使用BRCA_GE、LUAD_GE、PRAD_GE数据集进行实验,每种方法选择500个基因并送往GeneCards(https://www.genecards.org/)进行分析,以获得相应的相关性得分。相关性得分是评估特征选择结果的指标,其中N表示每种方法在相关基因库中选择的重叠基因数量,MRS是所选基因的最大相关性得分。最大相关性得分越高,异常表达基因导致癌症的概率就越高。
以下是六种方法的特征选择性能详细结果:
| 数据集 | BRCA_GE | | LUAD_GE | | PRAD_GE | |
| — | — | — | — | — | — | — |
| 方法 | N | MRS | N | MRS | N | MRS |
| NMF | 166 | 29.89 | 151 | 69.68 | 108 | 24.10
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



