文章地址:https://www.journals.elsevier.com/information-processing-and-management
DOI: https://doi.org/10.1016/j.ipm.2020.102411
期刊ISSN:0306-4573(二区)
影响因子(IF):4.041
发布时间:2020年10月19日
摘要
肺炎是一种导致儿童高死亡率的全球性疾病。由于新型冠状病毒COVID-19的爆发,目前已有983,907人死亡。随着感染的进展,感染病毒的人会出现发烧、咳嗽和肺炎等症状。及时发现是公众达成的共识,有助于可能的治疗,从而遏制COVID-19的传播。x线作为一种的成像技术,已被广泛应用于COVID-19等病毒引起的肺炎的检测。为了方便肺炎的诊断过程,本文开发了一个深度学习框架,用于二元分类任务,根据作者提出的CGNet将胸部x线图像分为正常和肺炎。
在本文的CGNet中,主要包括三个部分:特征提取、基于图的特征重构和分类。首先使用迁移学习技术训练最先进的卷积神经网络(CNNs)进行二值分类,同时使用训练过的CNNs为两个组件生成特征。然后,通过部署基于图的特征重构,作者通过图来组合特征去重构特征。最后,用一种名为GNet的浅层神经网络(一种单层图神经网络)将x线胸片图像分为正常胸片和肺炎胸片。模型在包括5,856张胸片的公共肺炎数据集上获得了最佳的精度为0.9872,灵敏度为1,特异性为0.9795。为了评估提出的方法对COVID-19肺炎的检测性能,作者还在一个公共COVID-19 CT数据集上测试了提出的方法,在精确度为0.99,特异性为1和灵敏度为0.98的情况下,作者获得了最高的性能。
一、介绍
肺炎是一种由病毒和细菌引起的常见但严重的肺部疾病。虽然在大多数情况下可以治疗,但及时发现仍然是诊断和治疗的关键。新冠肺炎疫情发生以来,病毒核酸技术和影像学技术被广泛应用于新冠肺炎的快速诊断。有报道称VNATs的灵敏度较高,但与基于图像的检测方法相比,假阳性率相对较高。正如作者在Fang等人指出的,在51例数据集上,采用实时聚合酶链反应(RT-PCR)的VNAT的敏感性为71%,而胸部计算机断层扫描(CT)显示的敏感性为98%。
胸部x光成像也被广泛用于检测由新冠肺炎引起的肺炎,与迷走神经刺激术相比,胸部x光成像更准确和方便,这使得胸部x光成为最流行的诊断肺炎的技术。
还有,与CT相比,X线更受欢迎,因为它成本低,成像方便。然而,由于复杂性和人为因素,数字化图像的人工判读是一项耗时的任务,对放射科医师来说仍然是一项具有挑战性的工作。因此,能够帮助放射科医生理解图像的自动系统要求很高,并且将极大地有助于减缓新冠肺炎的传播。
深度学习是机器学习的一个快速发展的分支,在图像分类和检测方面显示出巨大的潜力。与严重依赖手工制作特征的经典最大似然方法相比,最典型的最大似然方法模型——深度卷积神经网络在大量基于图像的任务(如检测、分类和分割)上取得了引人注目的成功。
通常在数百万幅图像上训练的DL模型比传统的ML模型学习更抽象的特征,传统的ML模型侧重于学习更简单但不太具代表性的特征。因此,相对于传统的最大似然模型,最大似然模型在准确性、灵活性方面表现出了巨大的优势。在某些领域,DL模型的表现甚至超过了该领域的专家。鉴于上述优势,数字图书馆技术已经被嵌入到许多计算机辅助设计系统中。对于DL系统,如何有效地将有用的信息嵌入到系统中决定了系统的最终性能。关于信息嵌入有大量的研究工作。
本研究提出了一种新的基于特征重构方法的数据链模型CGNet框架。基于所提出的框架,开发了一个新的高性能肺炎检测系统。在提出的CGNet框架中,有三个模块,包括特征提取和基于图的特征重构和分类。
对于特征提取,作者用了最先进的网络,并用肺炎数据集进行了训练。高级特征是进一步分类的粗略特征,然后可以通过训练的网络获得。
基于提取的特征,作者提出在单个图像之间集成图形表示,以提高后续分类器的精度,分类器具有与人工神经网络(ANN)相同的结构,但性能大大优于ANN。
与传统的单独分析图像的ANN不同,作者提出的神经网络可以利用图像之间的潜在关系来提高分类性能,从而同时分析多幅图像。
GNet的体系结构被设计得很浅,以避免过拟合问题和整个系统不必要的过度复杂。每幅图像的特征被视为图中的一个节点,而节点之间的边被分配给与该节点距离最短的前k个邻居。
为了验证根据新提出的框架设计的模型,作者在公共x光肺炎数据集和公共计算机断层图像新冠肺炎数据集上评估了模型的性能。如实验中所示,开发的系统在具有5000多幅图像的公共肺炎数据集上显示出比较好的结果,而开发的系统在公共新冠肺炎数据集上达到0.99的精确度。像肺炎引起的其他细菌和病毒会引起炎症和气囊,或肺泡在肺部,新冠肺炎引起的肺炎显示类似的症状。因此,我们相信所开发的系统可有助于将来诊断由新冠肺炎和其他原因引起的肺炎。
二、相关的工作
特征重构已被证明能有效提高前向深度神经网络的性能。当考虑特征重建问题时,目标特征矩阵
可以用下面共同来表示:
主成分分析(PCA)是一种广泛应用的特征降维和重构技术。
给定一组特征Fi(i是Nis组中特征的数量),则平均特征可以表示为:
协方差矩阵C由下式给出
在计算特征值和特征向量之后,特征Fi可以通过选择对应于第一最大k个特征值的第一k个特征向量来重构。
DL在不同领域得到了快速发展和广泛应用,尤其是在过去几年。此外,许多用于图像分析的计算机辅助设计系统已经使用了数字线技术,因为数字线具有优异的性能。因此,将特征重构与数字图像处理技术相结合,探索性能更好的图像分析系统是一种很有启发性的方法。自新冠肺炎疫情爆发以来,计算机科学界的专家一直在努力开发用于检测新冠肺炎肺炎的计算机辅助设计系统,这有助于检测新冠肺炎。
在这些作品中,迁移学习因其优点而被广泛使用。通常,从头开始训练一个深度CNN需要很长时间,而训练后的CNN的表现可能远远不能令人满意。因此,迁移学习,一种为新任务重用现有分辨率的技术,可以更有效地用于建立CNN模型。在迁移学习中,基本网络是在不同数据集上训练的网络,通常在图像网上。基础网络的体系结构被相应地调整以满足特定的图像分析任务。然后可以通过感兴趣的数据集来训练调整后的网络。
==此外,基本网络可以用作特征提取器,为分类器提供提取的特征。鉴于转移学习的优势,转移学习已被用于肺炎的检测。==例如,提出了一个名为切斯特网的深度转移学习模型,用于检测包括肺炎在内的多种胸腔疾病。
作者使用ResNet架构作为主干,在x光图像上实现了每类0.7810的曲线下平均面积。该模型在CAFFE框架(