基因子集选择与前列腺癌生物标志物鉴定研究
在基因研究领域,基因子集选择和生物标志物鉴定对于疾病的诊断和治疗具有重要意义。本文将介绍基因子集选择的新方法以及前列腺癌生物标志物鉴定的创新策略。
基因子集选择的计算实验
在基因子集选择的研究中,进行了两组计算实验。
- 第一组实验 :将三种过滤方法(LSGP、DF - LSGP 和 BF - LSGP)与贪婪对(GP)方法进行比较。使用了两个公开可用的数据集(Golub 和 Alon),并对其进行了与之前研究相同的预处理,分别重命名为 Alon2 和 Golub2。在实验中,设定所需基因数量 r = |S| ≈ 50,并跟踪大小 ≤ r 的最佳子集 Best - S。通过十次十折交叉验证应用了四种分类器,并返回 r 子集 S 和最佳子集 Best - S 在一百折中平均准确率。结果表明,四种过滤方法在高度可分离的 Golub2 数据集上表现最佳,在边界可分离的 Alon2 数据集上表现最差。基于图的方法 DF - LSGP 和 BF - LSGP 总体上比 LSGP 和 GP 表现更好,其曲线平均更高,且三种方法返回的最佳子集 Best - S 比 GP 返回的更小。这是因为基于图的方法利用了当前选定 S 子集中的信息来决定下一步选择哪些 LS 对,而 GP 和 LSGP 对 LS 对的选择则较为随意,仅基于其排名。
- 第二组实验 :在十折交叉验证框架内的训练数据集上进行排名和子集选择。将数据集 D 划分为十个不同部分,在十折交叉验证的每次迭代中:
1. 在九部分训练集上进行特征排名和选择;
2. 仅使用选定的基因在该训练集上训练分类器;
超级会员免费看
订阅专栏 解锁全文
10万+

被折叠的 条评论
为什么被折叠?



