46、基于深度学习的脑部肿瘤检测方法研究

最新推荐文章于 2025-12-06 22:45:43 发布

p5l2m9n4o6q

最新推荐文章于 2025-12-06 22:45:43 发布

阅读量34

点赞数

CC 4.0 BY-SA版权

分类专栏：探索智能系统与网络前沿文章标签：深度学习脑部肿瘤检测 MRI图像

本文链接：https://blog.youkuaiyun.com/p5l2m9n4o6q/article/details/149761728

探索智能系统与网络前沿专栏收录该内容

51 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

基于深度学习的脑部肿瘤检测方法研究

1. 引言

脑部肿瘤是人体大脑中异常生长且失控的细胞团。亚洲因脑部肿瘤死亡的人数最多。与人体其他肿瘤不同，由于颅骨的限制，脑部肿瘤的发展区域有限。正在发展的脑部肿瘤可能会压迫受内分泌系统严重损害的关键脑区，从而导致严重的健康问题。因此，早期准确诊断脑部肿瘤并提供治疗至关重要。

多年来，数据挖掘技术一直用于从大型数据集中提取有意义的信息。对图像或图像片段进行分类是医学图像分析的重要任务之一。支持向量机（SVM）、决策树、随机森林、模糊C均值、贝叶斯分类器和人工神经网络等都被用于通过胸部X光检测新冠和通过MRI扫描检测脑部肿瘤。近年来，深度学习（DL）算法模型逐渐取代了传统机器学习（ML）模型，因为DL模型不需要像SVM或K近邻等经典设计那样多的节点。

许多研究都在尝试确定脑部肿瘤的类型。例如，Sarhan等人建议在将脑部MRI图像发送到CNN分类器之前，先用小波对其进行分解，该方法显著降低了CNN分类器的复杂性，每个分类的准确率达到了99.3%。Ismael等人使用改进的ResNet50设计对脑部肿瘤进行分类，在训练时，对3064张T1加权MRI图像进行数据增强后，总准确率达到99%，未增强时对三类分类问题的准确率为95%。

本研究的重要贡献包括：
- 提出一个用于从脑部MRI图像中检测脑部恶性肿瘤的DL框架，并解释DL模型在脑部MRI数据图像处理中的工作原理。
- 在一个开放的脑部MRI图像数据集上对模型进行训练和测试。
- 将模型的性能与当前的先进技术进行比较。

2. 提出的方法

2.1 模型架构

模型由多个块组成，每个块有多层，执行六种基本操作，分别是Conv2D、MaxPooling2D、Activation、Flatten、Dropout、Dense。

架构的最后一层是输出层，使用sigmoid激活函数。

2.2 实验与结果讨论

2.2.1 数据集

本研究使用的数据集来自Kaggle。第一个数据集（D1）包含3060张良性肿瘤、恶性肿瘤、垂体肿瘤和无肿瘤的图像。第二个数据集（D2）包含3264张胶质瘤、恶性肿瘤、垂体肿瘤和无肿瘤的图像，在本研究中，仅使用D2中的胶质瘤和无肿瘤图像进行二分类。

D1中有2107张图像用于训练网络，903张用于测试；D2中有929张图像用于训练，399张用于测试。对图像进行了数据增强操作，即重新缩放。

2.2.2 数据预处理

对MRI样本进行了预处理。所有图像均为JPG格式，24位，96 dpi，512×512像素，将其缩放至224×224像素以匹配所提出的DNN的输入维度。缩放后，将所有RGB照片转换为灰度图像。

2.2.3 超参数

DL技术鼓励将问题分解为不同部分来解决。由于密集网络结构下集体神经元的工作原理未知，因此不解释产生结果的逻辑。可以调整以下参数来提高模型性能：
- 损失函数
- 优化器
- 层数
- 丢弃率
- 训练轮数

损失函数用于告知优化器其操作是否正确，通过权衡权重，优化器以最精确的形式塑造和创建模型。丢弃率用于防止网络过拟合，通常将概率设置为0.5。人为增加数据可以增加训练集的大小，防止网络正则化。调整层数和训练轮数可以提高模型的准确性。

2.2.4 实验设置与评估

所提出的模型使用Keras框架实现，以TensorFlow为后端。实验在一台配备4GB RAM的HP Intel Core i5笔记本电脑上进行，模型使用Google Collaboratory GPU进行训练。每个CNN神经元使用relu激活函数，输出分为肿瘤患者和非肿瘤患者两组。使用的损失函数是二元交叉熵，批量大小为32，优化器为Adam，Dense层的激活函数为sigmoid，网络训练30个轮次。

模型在训练集和验证集上的结果如下表所示：
| 数据集 | 优化器 | 训练准确率 | 训练损失 | 验证准确率 | 验证损失 |
| — | — | — | — | — | — |
| D1 | Adam | 1.0000 | 2.4627e - 04 | 0.9810 | 0.2615 |
| D2 | Adam | 1.0000 | 0.0022 | 1.0000 | 0.0039 |

从结果可以看出，训练集的准确率达到了100.00%，损失几乎为零，这表明模型在训练阶段取得了很好的进展。验证集的准确率达到了98.10%（D1）和100.00%（D2），说明模型能够以较高的准确率预测新数据。

2.2.5 验证协议和评估指标

为了验证模型，采用了10折交叉验证技术对数据集D1和D2进行训练和测试。10折交叉验证的过程如下：假设总数据集有100个数据样本，将样本1 - 10划分为子集1，样本11 - 20划分为子集2，依此类推，得到十个不同的数据集子集。然后在子集1 - 9上训练要评估的架构，在子集10上进行测试。

10折交叉验证的准确率如下表所示：
| 数据集 | K1 | K2 | K3 | K4 | K5 | K6 | K7 | K8 | K9 | K10 | 平均 |
| — | — | — | — | — | — | — | — | — | — | — | — |
| D1 | 99.67 | 99.34 | 99.00 | 98.67 | 99.67 | 99.34 | 100.0 | 99.34 | 98.67 | 99.67 | 99.34(±0.42) |
| D2 | 100.0 | 99.25 | 99.25 | 100.0 | 100.0 | 100.0 | 98.50 | 100.0 | 99.24 | 99.24 | 99.55(±0.50) |

此外，还提供了混淆矩阵、分类报告和ROC曲线来评估模型的性能。混淆矩阵显示了模型正确和错误预测的分布情况。例如，在数据集D1和D2的混淆矩阵中，模型正确检测出了大部分实际肿瘤图像，同时误诊的正常病例很少。

分类报告用于评估分类算法的预测准确性，显示了每个类别的关键分类指标，如精确率、召回率和F1分数。对于D2，召回率达到了100%，这意味着模型没有将脑部肿瘤患者误分类为正常。

ROC曲线描绘了模型的性能，AUC表示可分离程度，ROC是一个概率曲线，它表达了模型区分不同类别的能力。本研究中，脑部肿瘤检测模型的AUC分数为1.00，表明模型具有很高的类别分离能力。

与其他现有方法的性能比较如下表所示：
| 作者 | 年份 | 数据集 | 目的 | 技术 | 准确率(%) |
| — | — | — | — | — | — |
| Sarhan等人 | 2020 | Cheng的“脑部肿瘤数据集” | 分类：脑膜瘤/胶质瘤/垂体肿瘤 | WCNN | 99.30 |
| Bhanothu等人 | 2020 | - | - | Faster - R - CNN | 77.60 |
| Ismael等人 | 2020 | - | - | ResNet50 | 99.00 |
| Kaplan等人 | 2020 | - | - | KNN | 95.56 |
| Rehman等人 | 2020 | - | - | VGG16 | 98.69 |
| Tahir等人 | 2020 | - | - | SVM | 86.00 |
| Sethy等人 | 2021 | - | - | VGG19 + SVM | 97.89 |
| Gajula等人 | 2021 | - | - | U - Net | 96.90 |
| Ahmadi等人 | 2021 | - | - | CNN | 96.00 |
| Saffar等人 | 2021 | - | - | MLP + SVM | 91.02 |
| Kaldera等人 | 2019 | Cheng的“脑部肿瘤数据集” | - | Faster - R - CNN | 94.00 |
| 提出的DNN | Kaggle | - | - | CNN | 99.43 |

从比较结果可以看出，本研究提出的模型在脑部肿瘤检测方面取得了较好的效果。

综上所述，本研究提出的定制化DL模型在10折交叉验证后，平均验证准确率达到了100%。D1的平均准确率为99.22%，灵敏度为98.94%，特异性为99.53%，F1分数为99.26%；D2的平均准确率为99.43%，灵敏度为98.86%，特异性为100%，F1分数为99.43%。未来的研究将通过升级DNN模型来关注特异性、灵敏度、恢复率和F1分数等性能指标。所提出的模型方法可以进一步扩展到脑部肿瘤的分割，即如果检测到脑部肿瘤，模型可以定位受影响的区域，这将有助于医生更有效地发现和分析脑部癌症。

3. 结论与展望

3.1 研究成果总结

本研究提出的定制化深度学习（DL）模型在脑部肿瘤检测方面展现出了卓越的性能。经过10折交叉验证，模型取得了平均100%的验证准确率。具体来看，在数据集D1上，平均准确率达到99.22%，灵敏度为98.94%，特异性为99.53%，F1分数为99.26%；在数据集D2上，平均准确率为99.43%，灵敏度为98.86%，特异性为100%，F1分数为99.43%。

通过与其他现有方法的比较，如Sarhan等人的WCNN、Bhanothu等人的Faster - R - CNN等，本模型在准确率上表现更优，充分证明了其在脑部肿瘤检测领域的有效性和先进性。

3.2 未来研究方向

未来的研究将围绕以下几个方面展开，以进一步提升模型性能和拓展其应用范围：
- 性能指标优化 ：通过升级深度神经网络（DNN）模型，重点关注特异性、灵敏度、恢复率和F1分数等性能指标，使模型在脑部肿瘤检测中更加精准。
- 肿瘤分割扩展 ：将目前的检测模型扩展到脑部肿瘤的分割任务。当检测到脑部肿瘤时，模型能够准确地定位受影响的区域，为医生提供更详细的信息，有助于制定更精准的治疗方案。
- 多模态数据融合 ：考虑引入更多模态的数据，如CT图像、PET图像等，与MRI数据进行融合。多模态数据可以提供更丰富的信息，有助于提高模型对脑部肿瘤的识别和分析能力。
- 临床应用验证 ：将模型应用于实际临床场景，与医生的诊断结果进行对比和验证。通过大量的临床数据，进一步评估模型的实用性和可靠性，为其在临床实践中的推广奠定基础。

3.3 整体流程回顾

为了更清晰地展示本研究的整体流程，以下是一个mermaid格式的流程图：

graph TD;
    A[数据收集] --> B[数据预处理];
    B --> C[模型构建];
    C --> D[模型训练];
    D --> E[模型评估];
    E --> F[结果分析];
    F --> G[模型优化与扩展];

3.4 关键技术点总结

在本研究中，涉及到的关键技术点总结如下：
- 模型架构 ：采用了由多个块组成的架构，包含Conv2D、MaxPooling2D、Activation、Flatten、Dropout、Dense等操作，通过合理设置滤波器数量、大小和激活函数，构建了高效的深度学习模型。
- 数据处理 ：对MRI图像进行了缩放和灰度转换等预处理操作，同时进行了数据增强，以提高模型的泛化能力。
- 超参数调整 ：通过调整损失函数、优化器、层数、丢弃率和训练轮数等超参数，优化模型性能。
- 评估指标 ：使用准确率、损失、混淆矩阵、分类报告和ROC曲线等多种评估指标，全面评估模型的性能。