46、基于深度学习的脑部肿瘤检测方法研究

基于深度学习的脑部肿瘤检测方法研究

1. 引言

脑部肿瘤是人体大脑中异常生长且失控的细胞团。亚洲因脑部肿瘤死亡的人数最多。与人体其他肿瘤不同,由于颅骨的限制,脑部肿瘤的发展区域有限。正在发展的脑部肿瘤可能会压迫受内分泌系统严重损害的关键脑区,从而导致严重的健康问题。因此,早期准确诊断脑部肿瘤并提供治疗至关重要。

多年来,数据挖掘技术一直用于从大型数据集中提取有意义的信息。对图像或图像片段进行分类是医学图像分析的重要任务之一。支持向量机(SVM)、决策树、随机森林、模糊C均值、贝叶斯分类器和人工神经网络等都被用于通过胸部X光检测新冠和通过MRI扫描检测脑部肿瘤。近年来,深度学习(DL)算法模型逐渐取代了传统机器学习(ML)模型,因为DL模型不需要像SVM或K近邻等经典设计那样多的节点。

许多研究都在尝试确定脑部肿瘤的类型。例如,Sarhan等人建议在将脑部MRI图像发送到CNN分类器之前,先用小波对其进行分解,该方法显著降低了CNN分类器的复杂性,每个分类的准确率达到了99.3%。Ismael等人使用改进的ResNet50设计对脑部肿瘤进行分类,在训练时,对3064张T1加权MRI图像进行数据增强后,总准确率达到99%,未增强时对三类分类问题的准确率为95%。

本研究的重要贡献包括:
- 提出一个用于从脑部MRI图像中检测脑部恶性肿瘤的DL框架,并解释DL模型在脑部MRI数据图像处理中的工作原理。
- 在一个开放的脑部MRI图像数据集上对模型进行训练和测试。
- 将模型的性能与当前的先进技术进行比较。

2. 提出的方法

2.1 模型架构

模型由多个块组成,每个块有多层,执行六种基本操作,分别是Conv2D、MaxPooling2D、Activation、Flatten、Dropout、Dense。

模型架构的第一层是输入层,输入形状为(224, 224, 1),步长为2。第二层是卷积层,有128个滤波器,滤波器大小为1×1,随后是激活函数relu和2×2的最大池化层。接下来还有多个卷积层和池化层,具体如下:
| Layer (type) | Output shape | Param |
| — | — | — |
| conv2d (Conv2D) | (None, 224, 224, 128) | 256 |
| max_pooling2d (MaxPooling2) | (None, 112, 112, 128) | 0 |
| conv2d_1 (Conv2D) | (None, 110, 110, 128) | 147584 |
| max_pooling2d_1 (MaxPooling2) | (None, 55, 55, 128) | 0 |
| conv2d_2 (Conv2D) | (None, 51, 51, 64) | 204864 |
| max_pooling2d_2 (MaxPooling2) | (25, 25, 64) | 0 |
| conv2d_3 (Conv2D) | (None, 23, 23, 64) | 36928 |
| max_pooling2d_3 (MaxPooling2) | (None, 11, 11, 64) | 0 |
| conv2d_4 (Conv2D) | (None, 9, 9, 32) | 18464 |
| max_pooling2d_3 (MaxPooling2) | (None, 4, 4, 32) | 0 |
| conv2d_5 (Conv2D) | (None, 4, 4, 32) | 1056 |
| max_pooling2d_3 (MaxPooling2) | (None, 4, 4, 32) | 0 |
| flatten (Flatten) | (None, 512) | 0 |
| dense (Dense) | (None, 128) | 65664 |
| dropout_1 (Dropout) | (None, 128) | 0 |
| dense_1 (Dense) | (None, 64) | 8256 |
| dropout_2 (Dropout) | (None, 64) | 0 |
| dense_2 (Dense) | (None, 1) | 65 |
| 总参数 | | 483,137 |

架构的最后一层是输出层,使用sigmoid激活函数。

2.2 实验与结果讨论

2.2.1 数据集

本研究使用的数据集来自Kaggle。第一个数据集(D1)包含3060张良性肿瘤、恶性肿瘤、垂体肿瘤和无肿瘤的图像。第二个数据集(D2)包含3264张胶质瘤、恶性肿瘤、垂体肿瘤和无肿瘤的图像,在本研究中,仅使用D2中的胶质瘤和无肿瘤图像进行二分类。

D1中有2107张图像用于训练网络,903张用于测试;D2中有929张图像用于训练,399张用于测试。对图像进行了数据增强操作,即重新缩放。

2.2.2 数据预处理

对MRI样本进行了预处理。所有图像均为JPG格式,24位,96 dpi,512×512像素,将其缩放至224×224像素以匹配所提出的DNN的输入维度。缩放后,将所有RGB照片转换为灰度图像。

2.2.3 超参数

DL技术鼓励将问题分解为不同部分来解决。由于密集网络结构下集体神经元的工作原理未知,因此不解释产生结果的逻辑。可以调整以下参数来提高模型性能:
- 损失函数
- 优化器
- 层数
- 丢弃率
- 训练轮数

损失函数用于告知优化器其操作是否正确,通过权衡权重,优化器以最精确的形式塑造和创建模型。丢弃率用于防止网络过拟合,通常将概率设置为0.5。人为增加数据可以增加训练集的大小,防止网络正则化。调整层数和训练轮数可以提高模型的准确性。

2.2.4 实验设置与评估

所提出的模型使用Keras框架实现,以TensorFlow为后端。实验在一台配备4GB RAM的HP Intel Core i5笔记本电脑上进行,模型使用Google Collaboratory GPU进行训练。每个CNN神经元使用relu激活函数,输出分为肿瘤患者和非肿瘤患者两组。使用的损失函数是二元交叉熵,批量大小为32,优化器为Adam,Dense层的激活函数为sigmoid,网络训练30个轮次。

模型在训练集和验证集上的结果如下表所示:
| 数据集 | 优化器 | 训练准确率 | 训练损失 | 验证准确率 | 验证损失 |
| — | — | — | — | — | — |
| D1 | Adam | 1.0000 | 2.4627e - 04 | 0.9810 | 0.2615 |
| D2 | Adam | 1.0000 | 0.0022 | 1.0000 | 0.0039 |

从结果可以看出,训练集的准确率达到了100.00%,损失几乎为零,这表明模型在训练阶段取得了很好的进展。验证集的准确率达到了98.10%(D1)和100.00%(D2),说明模型能够以较高的准确率预测新数据。

2.2.5 验证协议和评估指标

为了验证模型,采用了10折交叉验证技术对数据集D1和D2进行训练和测试。10折交叉验证的过程如下:假设总数据集有100个数据样本,将样本1 - 10划分为子集1,样本11 - 20划分为子集2,依此类推,得到十个不同的数据集子集。然后在子集1 - 9上训练要评估的架构,在子集10上进行测试。

10折交叉验证的准确率如下表所示:
| 数据集 | K1 | K2 | K3 | K4 | K5 | K6 | K7 | K8 | K9 | K10 | 平均 |
| — | — | — | — | — | — | — | — | — | — | — | — |
| D1 | 99.67 | 99.34 | 99.00 | 98.67 | 99.67 | 99.34 | 100.0 | 99.34 | 98.67 | 99.67 | 99.34(±0.42) |
| D2 | 100.0 | 99.25 | 99.25 | 100.0 | 100.0 | 100.0 | 98.50 | 100.0 | 99.24 | 99.24 | 99.55(±0.50) |

此外,还提供了混淆矩阵、分类报告和ROC曲线来评估模型的性能。混淆矩阵显示了模型正确和错误预测的分布情况。例如,在数据集D1和D2的混淆矩阵中,模型正确检测出了大部分实际肿瘤图像,同时误诊的正常病例很少。

分类报告用于评估分类算法的预测准确性,显示了每个类别的关键分类指标,如精确率、召回率和F1分数。对于D2,召回率达到了100%,这意味着模型没有将脑部肿瘤患者误分类为正常。

ROC曲线描绘了模型的性能,AUC表示可分离程度,ROC是一个概率曲线,它表达了模型区分不同类别的能力。本研究中,脑部肿瘤检测模型的AUC分数为1.00,表明模型具有很高的类别分离能力。

与其他现有方法的性能比较如下表所示:
| 作者 | 年份 | 数据集 | 目的 | 技术 | 准确率(%) |
| — | — | — | — | — | — |
| Sarhan等人 | 2020 | Cheng的“脑部肿瘤数据集” | 分类:脑膜瘤/胶质瘤/垂体肿瘤 | WCNN | 99.30 |
| Bhanothu等人 | 2020 | - | - | Faster - R - CNN | 77.60 |
| Ismael等人 | 2020 | - | - | ResNet50 | 99.00 |
| Kaplan等人 | 2020 | - | - | KNN | 95.56 |
| Rehman等人 | 2020 | - | - | VGG16 | 98.69 |
| Tahir等人 | 2020 | - | - | SVM | 86.00 |
| Sethy等人 | 2021 | - | - | VGG19 + SVM | 97.89 |
| Gajula等人 | 2021 | - | - | U - Net | 96.90 |
| Ahmadi等人 | 2021 | - | - | CNN | 96.00 |
| Saffar等人 | 2021 | - | - | MLP + SVM | 91.02 |
| Kaldera等人 | 2019 | Cheng的“脑部肿瘤数据集” | - | Faster - R - CNN | 94.00 |
| 提出的DNN | Kaggle | - | - | CNN | 99.43 |

从比较结果可以看出,本研究提出的模型在脑部肿瘤检测方面取得了较好的效果。

综上所述,本研究提出的定制化DL模型在10折交叉验证后,平均验证准确率达到了100%。D1的平均准确率为99.22%,灵敏度为98.94%,特异性为99.53%,F1分数为99.26%;D2的平均准确率为99.43%,灵敏度为98.86%,特异性为100%,F1分数为99.43%。未来的研究将通过升级DNN模型来关注特异性、灵敏度、恢复率和F1分数等性能指标。所提出的模型方法可以进一步扩展到脑部肿瘤的分割,即如果检测到脑部肿瘤,模型可以定位受影响的区域,这将有助于医生更有效地发现和分析脑部癌症。

3. 结论与展望

3.1 研究成果总结

本研究提出的定制化深度学习(DL)模型在脑部肿瘤检测方面展现出了卓越的性能。经过10折交叉验证,模型取得了平均100%的验证准确率。具体来看,在数据集D1上,平均准确率达到99.22%,灵敏度为98.94%,特异性为99.53%,F1分数为99.26%;在数据集D2上,平均准确率为99.43%,灵敏度为98.86%,特异性为100%,F1分数为99.43%。

通过与其他现有方法的比较,如Sarhan等人的WCNN、Bhanothu等人的Faster - R - CNN等,本模型在准确率上表现更优,充分证明了其在脑部肿瘤检测领域的有效性和先进性。

3.2 未来研究方向

未来的研究将围绕以下几个方面展开,以进一步提升模型性能和拓展其应用范围:
- 性能指标优化 :通过升级深度神经网络(DNN)模型,重点关注特异性、灵敏度、恢复率和F1分数等性能指标,使模型在脑部肿瘤检测中更加精准。
- 肿瘤分割扩展 :将目前的检测模型扩展到脑部肿瘤的分割任务。当检测到脑部肿瘤时,模型能够准确地定位受影响的区域,为医生提供更详细的信息,有助于制定更精准的治疗方案。
- 多模态数据融合 :考虑引入更多模态的数据,如CT图像、PET图像等,与MRI数据进行融合。多模态数据可以提供更丰富的信息,有助于提高模型对脑部肿瘤的识别和分析能力。
- 临床应用验证 :将模型应用于实际临床场景,与医生的诊断结果进行对比和验证。通过大量的临床数据,进一步评估模型的实用性和可靠性,为其在临床实践中的推广奠定基础。

3.3 整体流程回顾

为了更清晰地展示本研究的整体流程,以下是一个mermaid格式的流程图:

graph TD;
    A[数据收集] --> B[数据预处理];
    B --> C[模型构建];
    C --> D[模型训练];
    D --> E[模型评估];
    E --> F[结果分析];
    F --> G[模型优化与扩展];

3.4 关键技术点总结

在本研究中,涉及到的关键技术点总结如下:
- 模型架构 :采用了由多个块组成的架构,包含Conv2D、MaxPooling2D、Activation、Flatten、Dropout、Dense等操作,通过合理设置滤波器数量、大小和激活函数,构建了高效的深度学习模型。
- 数据处理 :对MRI图像进行了缩放和灰度转换等预处理操作,同时进行了数据增强,以提高模型的泛化能力。
- 超参数调整 :通过调整损失函数、优化器、层数、丢弃率和训练轮数等超参数,优化模型性能。
- 评估指标 :使用准确率、损失、混淆矩阵、分类报告和ROC曲线等多种评估指标,全面评估模型的性能。

3.5 总结

本研究提出的基于深度学习的脑部肿瘤检测方法在准确性和可靠性方面取得了显著成果。通过不断优化模型和拓展应用范围,有望为脑部肿瘤的早期诊断和治疗提供有力的支持。未来的研究将继续探索新的技术和方法,推动脑部肿瘤检测领域的发展。

希望本研究能够为相关领域的研究人员和临床医生提供有价值的参考,共同为改善脑部肿瘤患者的健康状况做出贡献。

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值