A High-Performance Deep Neural Network Model for BI-RADS Classification of Screening Mammography

在全球范围内,乳腺癌的发病率居首位。早期乳腺癌的治疗具有很高的成本效益。0-2期乳腺癌5年生存率超过90%。筛查性乳房x线照相术被认为是早期诊断乳腺癌最可靠的方法。台湾政府一直敦促年龄在45岁至69岁之间、无任何症状的女性每两年进行一次乳房x光检查。这给放射科医生带来了巨大的工作量。有鉴于此,本文提出一种基于深度神经网络(DNN)的模型,作为一种高效可靠的工具,以协助放射科医生进行乳腺x线影像解释。文献中首次将乳房x线照片完全分为BI-RADS 0、1、2、3、4A、4B、4C和5类。本文提出的模型是使用从我们自己的乳房x线照片数据集分割出来的基于块的图像进行训练的。将基于块的图像应用于模型作为输入,并预测BI-RADS类别作为输出。结果表明,本研究的总体准确率为94.22%,平均敏感性为95.31%,平均特异性为99.15%,AUC为0.9723。

模型与方法

本文提出了一个基于dnn的模型,将乳房x线照片分类为0、1、2、3、4A、4B、4C和5类,但不包括6类,因为6类用于代表被诊断为乳腺癌的女性。如图3所示,使用从数据集中分割出来的基于块的图像对模型进行训练。将基于块的图像应用于模型作为输入,并指定一个类别作为输出。通过这种方式,对基于块的图像的特征图进行关联bi-rads

基于dnn的模型有以下优点:它使用了大量的块图像进行了良好的训练,为保证文献的完整性,这是首次将乳房x线照片分为8个BI-RADS类别。最后,可以对乳腺病变进行可靠的定位和有效的分类,使放射科医生能够加快对乳腺x线片的解释。

训练数据块

如前所述,本文使用大量大小为224 × 224像素的基于块的图像对模型进行训练。图4说明了块图像和块图像中包含的病变。如图4a,b所示,白色部分代表同一个乳房视图,将乳房x光片从右到左,再从上到下分割成重叠的块图像,步幅为36像素。此外,我们选择一个包含乳房的块图像占据不少于90%的块区域作为训练数据。

如图4c所示,块图像中包含了一部分病变。接下来,根据包含病变区域与块区域的比例,对块图像进行BI-RADS分类,分类如下:在案例1中,块图像不包含病变,因此被指定为BI-RADS类别1。否则,若块区域与病变区域交集占块区域或病变区域的50%,则视为病变样本。将块图像分配到以下层次结构中最高的类别:5,4C, 4B, 4A, 0, 3, 2。否则,块图像被指定为BI-RADS类别1。将所有块图像分为两部分,分别作为训练数据和测试数据。

模型结构 

 该模型是基于最先进的模型之一——EfficientNet构建的。如图5所示,该模型由Stem、Body、Head和Output组成,以尺寸为224 × 224像素的乳房x线片作为输入,即输入图像形状为224 × 224 × 1。在Stem模块中,首先对输入图像进行归一化,使其处于0到1之间,然后使用3 × 3卷积层提取特征图。随后,在Body模块中提取高级特征图,由16个移动倒置瓶颈卷积(MBConv)块[25]组成。最后,将特征图分为Head和Output两个模块。在activate -Swish块中使用Swish激活。与ReLU相比,在大多数情况下,使用Swish激活函数可以改善神经网络的性能。

最后,利用分类交叉熵损失函数训练batchsize为128、epoch为350的模型,并利用Ranger优化器提高训练性能。

实验结果

一个八类分类系统的混淆矩阵和每个类的四个性能指标,包括灵敏度,特异性,精度和f1 -分数,被评估以量化模型性能。然后,求出各性能指标的均值和总体精度。在图8中,使用了一个8 × 8混淆矩阵来说明在类型6 (BI-RADS类别4B)的情况下如何评估所有性能指标。真阳性(TP)和假阳性(FP)分别用来表示准确或错误分类为4B类的病变。同样地,真阴性(TN)和假阴性(FN)分别用来表示被准确分类或被错误识别为其他类别的病变。

使用85,683条测试数据进行性能测试,得到图9中的混淆矩阵和表6中的性能指标。随后,在图10中为每个BI-RADS类别ROC曲线,其中显示相应的AUC值。结果表明,本研究的平均敏感性为95.31%,平均特异性为99.15%,平均精密度为94.93%,平均f1评分为95.11%,平均AUC为97.23%,总体准确度高达94.22%。

 

BI-RADS 0类、4A类、4B类、4C类和5个病灶的每一例的敏感性、特异性和精密度分别超过98%、99%和96%。这证实了利用这项工作可以很好地分类这些病变,并且可以更准确地诊断早期乳腺癌。BI-RADS 2、3类病变的表现指标均在92%以上,略低于上述5例。BI-RADS 1类病灶表现最差,敏感度和准确率分别为81.22%和85.91%,原因如下。所有无病变的块图像均被归为BI-RADS 1类,导致特征不明显,难以诊断。

 一项更深入的调查显示,BI-RADS第1类病例的敏感性实际上是阈值thrB和thrL的函数。这是因为BI-RADS第1类的块图像实际上在某些病例中包含一小部分病变,这对模型的训练产生了负面影响。此外,每个性能指标也是thrB和thrL的函数。该模型的总体准确率为94.22%,平均敏感性为95.31%,平均特异性为99.15%。最后,表7列出了任务和性能的比较为了揭示这一工作的贡献和以往乳腺癌检测的研究。Ave_Sen、Ave_Spe和Acc分别代表平均敏感性、平均特异度和准确性。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值