跨癌症基因组分析与重型车辆分类的深度学习应用
跨癌症基因组分析
在癌症研究领域,利用机器学习模型进行癌症分类是一个重要的研究方向。研究人员应用无监督和有监督学习方法,通过基因表达数据来开发泛癌症诊断模型。
- 预测模型生成
- 数据划分 :针对六种组织样本数据集,分别进行 80 - 20 的测试 - 训练集划分,确保每种癌症的癌症和非癌症数据在最终测试集中无偏分布,然后将各组织的训练集和测试集合并,所有非癌症样本归为一类。
- 基因选择 :
- 基于互信息选取前 500 个基因作为基线基因集。
- 训练递归特征消除(RFE)模型,从 2000 个基因数据集中选出 200 个基因。RFE 先选取所有 2000 个基因中的最优基因,再递归地将移除的基因放回模型,直至剩下 200 个基因。
- 模型构建 :使用深度学习库 Keras 创建多层感知器(MLP),包含五个全连接层,除最后一层使用 softmax 激活函数外,其余层使用 tanh 激活函数。使用 Adam 优化器和分类交叉熵损失函数进行训练,训练 20 个周期后停止,以防止过拟合。
- 有监督学习结果
- 由于数据集中癌症和非癌症样本不平衡,报告了每种癌症的精确率、召回率和 F1 分数。
深度学习在基因组与车辆分类的应用
超级会员免费看
订阅专栏 解锁全文
58

被折叠的 条评论
为什么被折叠?



