机器学习算法在癌症数据中的应用及胰腺癌检测模型
机器学习算法在癌症数据分类中的应用
深度学习方法提升癌症数据分类准确性
在癌症数据分类中,一种深度学习方法展现出了良好的效果。该方法通过学习一级分类器结果之间的关系,相比独立训练模型,能自动学习特征,从而提高预测准确性。实验采用了TCGA的乳腺癌、胃癌和肺癌RNA测序数据,原始读取计数用于识别差异表达基因,FPKM值用于分类。结果显示,该深度学习方法比一级模型和多数投票算法具有更高的准确率。
基于迁移学习的癌症分类方法
Sevakula等人提出了一种基于迁移学习的方法,假设不同肿瘤类型之间存在共同特征,通过训练自动编码器学习初始参数,再针对特定问题进行参数微调。具体步骤如下:
1. 特征选择 :使用个体训练误差减少(ITER)排名方法对特征进行排序,为输入数据中的每个特征独立训练线性分类器,根据训练误差对特征进行排序,选择训练误差最小的特征。
2. 特征归一化 :使用零一归一化方法或均值 - 方差归一化方法对选定的特征值进行归一化。
3. 权重初始化 :使用自动编码器初始化神经网络各层的权重,每个自动编码器的结构与相应层匹配,依次学习各层的权重,直到最后一个隐藏层。
4. 权重微调 :使用基于中位数的方法对深度神经网络(DNN)的权重进行微调。
5. 分类 :将数据通过DNN转换为更适合分类的表示,然后将新构建的特征输入到Softmax分类器、随机森林(RF)和核支持向
超级会员免费看
订阅专栏 解锁全文
58

被折叠的 条评论
为什么被折叠?



