5.23.2 深度学习提高乳房 X 光检查中乳腺癌的检测率

开发了一种深度学习算法,该算法可以使用“端到端”训练方法在筛查乳房 X 光检查中准确检测出乳腺癌,该方法有效地利用了具有完整临床注释或仅具有整个图像的癌症 标签 的训练数据集。

在这种方法中,仅在初始训练阶段才需要病变注释,后续阶段只需要图像级标签,从而消除了对很少可用的病变注释的依赖。与以前的方法相比,我们用于对筛查乳房 X 光检查进行分类的全卷积网络方法获得了出色的性能。


作为图像分类任务,通过筛查性乳房X光检查检测亚临床乳腺癌具有挑战性,因为肿瘤本身仅占据整个乳房图像的一小部分。例如,全视野数字乳房 X 线摄影 (FFDM) 图像通常为 4000×3000 像素,而潜在癌性感兴趣区域 (ROI) 可能小至 100×100 像素。

因此,许多研究将其重点限制在注释病变的分类上。尽管对手动注释的 ROI 进行分类是重要的第一步,但全自动软件系统必须能够对整个乳房 X 线照片进行操作,以提供已知病变之外的附加信息并增强临床解释。如果 ROI 注释在乳房 X 线摄影数据库中广泛使用,那么可以轻松应用已建立的对象检测和分类方法,例如基于区域的卷积神经网络 (R-CNN)及其变体。然而,需要 ROI 注释的方法通常无法转移到缺乏 ROI 注释的大型乳腺 X 线摄影数据库。事实上,很少有公共乳房X线摄影数据库有完整的注释。

众所周知,深度学习需要大量的训练数据集才能最有效。因此,必须利用少数完全注释的数据集以及仅标记每张图像的癌症状态的较大数据集来提高乳腺癌分类算法的准确性。

当理想的大型且完整的训练数据集不可用时,预训练是解决训练分类器问题的一种很有前景的方法。使用逐层预训练来初始化具有三个隐藏层的深度信念网络(DBN)的权重参数,然后对其进行微调以进行分类。预训练提高了训练速度以及手写数字识别的准确性。另一种流行的训练方法是首先在大型数据库(例如 ImageNet32)上训练深度学习模型,然后针对其他任务微调模型。模型的权重参数已经初始化,用于识别边缘、角点和纹理等原始特征,这些特征可以轻松用于不同的任务。

使用带有 ROI 信息的完全注释数据集来预先训练用于分类局部图像块的模型。然后使用补丁分类器的权重参数来初始化整个图像分类器的权重参数,可以使用没有 ROI 注释的数据集进一步微调。

我们使用一个包含数千张图像的大型公共数字化胶片乳房X线摄影数据库来开发补丁和整个图像分类器,然后将整个图像分类器转移到一个包含数百张图像的较小的公共FFDM数据库。

1. 方法

1.1 将分类器从识别补丁转换为识别整个图像

为了对大型复杂图像执行分类或分割,一种常见的策略涉及使用滑动窗口方式的分类器来识别图像上的局部补丁,以生成概率输出网格。接下来是另一个过程,总结补丁分类器的输出,以给出最终的分类或分割结果。

假设有一个输入补丁X\in\mathrm{IR}^{\mathbf{p}\times\mathbf{q}}和一个补丁分类器:函数f,且函数f(X)\in\mathrm{IR}^{c},其中函数的输出满足f(X)_{i}\in[0,1] 以及 

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值