视频胶囊内窥镜多帧异常检测与NASNet-Large解码器网络技术解析
1. 视频胶囊内窥镜(VCE)技术概述
视频胶囊内窥镜(VCE)是一项新兴技术,为整个胃肠道(GI)提供了非侵入性成像。自2001年首款VCE设备PillCam SB(小肠型)推出以来,多家公司也开发了类似产品。例如,CapsoCam能产生一系列360°全景图像并存储在内部存储器中。与光纤内窥镜不同,VCE能遍历整个小肠或GI道,且患者不适感较小。在COVID - 19大流行初期,内窥镜检查活动受限,使得胶囊内窥镜的使用更加广泛。VCE正迅速成为各种小肠疾病(如乳糜泻、炎症性肠病和癌症)的主要筛查和诊断技术。
然而,VCE的应用仍存在局限性。审查VCE记录是一个繁琐的过程,需要大量的培训和经验。记录时长可达数小时,帧数从14400 - 72000不等,且胶囊在肠道内的运动和方向变化会导致一些异常情况模糊、遮挡或仅出现在单帧中。因此,医生必须仔细审查每个记录,并依靠相邻帧的上下文线索来识别和确认潜在异常。目前的VCE审查过程劳动强度大、成本高,且由于人为限制容易出现诊断错误。
2. 现有VCE模型的局限性
当前机器辅助VCE筛查主要有两个任务:胶囊定位和异常检测。过去十年,相关研究大多从手工特征转向深度学习方法。深度卷积神经网络(CNNs)在VCE异常分类中表现出色,自2015年以来,大多数异常检测研究的准确率超过90%,基于CNN的定位方法准确率达99%。
但现有的先进模型存在不足。它们大多基于单帧图像进行预测,依赖标准的“现成”模型,如Resnet。虽然单帧方法取得了一定成果,但与医生审查VCE记录的方式不同。医生通常会审查一系列图像来评估病变或其他结构缺陷。而且
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



