医学影像中的可解释人工智能应用
1. 高级别胶质瘤预测模型
在医学诊断中,对于高级别胶质瘤(High - Grade Glioma,HGG)的预测是一个重要的任务。给定一个输入样本,模型需要预测其对应的患者是否患有 HGG。胶质瘤具有一些临床医生认可的影像学特征,如液体衰减反转恢复序列(FLAIR)或 T2 加权高信号,以及明显的占位效应等,但这些特征通常只是一些线索。例如,占位效应虽然对胶质母细胞瘤具有预后意义,但却难以量化。
当使用 LRP - Epsilon 和 Deep Taylor 显著性图来揭示预测规则时,可以发现,尽管模型是针对全图像分类而非分割进行训练的,但它能够自行定位白质高信号(如图 11.2e 中的 LRP - Epsilon 图所示),并且似乎能够部分分离占位效应伪影(如图 11.2f 中的 Deep Taylor 图所示)。我们推测,虽然还需要进一步的工作,但这种事后预测图可以提供上述急需的影像学特征量化系统。
2. 人工智能模型的安全性和鲁棒性改进
在诊断医学中采用人工智能,信任是一个必要条件。为了支持机器辅助决策,病理学家首先要确保预测模型的准确性和泛化性能良好,即模型不仅要做出正确的预测,而且要有正确的决策依据。
2.1 确保模型决策依据正确
目前,许多人认为,鉴于当前深度神经网络(DNN)架构的高预测能力,要确保模型决策依据正确或避免明显错误,可能需要通过增加样本数据或采用启发式数据增强方案来增强模型的泛化能力。然而,即使是最详尽的数据集和性能指标,也需要额外的全局知识和专业技能。
例如,在一个预测肺炎患者护理优先级的模型中,哮喘患者实际上有更高的医疗风险,但模型却将他们定义为死于肺炎的风险较低。事后人为解释指出,有哮喘病史的患者会自动接受更积极的治疗,因此与其他患者相比,他们的医疗风险确实较低。这反映了需要针对特定领域进行训练,通过正则化惩罚等方式,使模型的解释与领域知识相匹配。
常见的做法是使用简单的模型,如线性回归或决策树作为替代模型,这样不仅可以提高模型的可解释性,还能增强鲁棒性并便于整合领域知识。
2.2 应对模型的不稳定性
人类倾向于进行反事实思考,信任意味着安全感和可靠性。如果预测模型容易出现明显错误,就无法实现信任。一些方法,如 DeepFool 或单像素攻击,表明许多知名的 DNN 架构对输入图像的小扰动不稳定。深度对抗攻击和防御技术引起了越来越多的关注,也引发了对 DNN 系统在临床环境中部署的巨大担忧。
以下是确保模型安全性和鲁棒性的一些关键要点总结:
|要点|说明|
| ---- | ---- |
|增强泛化能力|增加样本数据或采用启发式数据增强方案|
|匹配领域知识|通过正则化惩罚等方式使模型解释与领域知识一致|
|使用替代模型|如线性回归或决策树|
|应对不稳定性|关注深度对抗攻击和防御技术|
2.3 模型稳定性分析流程
graph LR
A[输入模型和数据] --> B[进行小扰动测试]
B --> C{模型是否稳定}
C -- 是 --> D[模型可接受]
C -- 否 --> E[分析不稳定原因]
E --> F[采取改进措施]
F --> B
3. 利用类激活图(CAM)研究阿尔茨海默病
在使用基于人工智能的软件之前,医疗从业者首先会问:“我们能信任人工智能模型做出的决策吗?” 可解释性对于信任人工智能至关重要,而类激活图(Class Activation Map,CAM)是一种标准的模型解释技术,已广泛应用于医学领域,用于解释深度模型的决策。
3.1 CAM 在阿尔茨海默病诊断中的应用
CAM 可以解释为 “深度卷积神经网络(CNN)关注的位置”,即空间组织数据中对于区分阿尔茨海默病(AD)患者和正常对照(NC)受试者最重要的区域。近年来,针对不同的医学成像模态,如正电子发射断层扫描(PET)和结构磁共振成像(MRI),已经提出了几种基于 CAM 的 AD 诊断方法。
例如,在一项研究中,作者提出了一个具有残差连接的 3D CNN 用于 AD 检测。该 CNN 为氟代脱氧葡萄糖(FDG) - PET 图像生成类激活图。生成的 CAM 清楚地突出了后扣带回皮质(PCC)区域,这与之前的临床研究一致,这些研究证实了这些大脑区域对 AD 诊断的鉴别能力。
3.2 磁共振波谱(MRS)与 AD 检测
磁共振波谱(Magnetic Resonance Spectroscopy,MRS)是另一种有前景的 AD 脑代谢研究技术。它可以安全、无创地检测大脑中的微小代谢变化,提供 “虚拟活检”。最近,1D CNN 已用于 MRS 代谢物定量和去除伪影。
在 AD 检测方面,MRS - 基于的检测即使在临床综合征(如认知障碍)不明显时也可能成功,而结构 MRI 或 FDG - PET 图像可能无法检测到有 AD 风险的患者。
3.3 DeepMRS 模型
最近提出的 DeepMRS 模型使用 MRS 数据进行 AD 检测。该模型使用来自普瓦捷大学医院的 135 名受试者的数据进行训练,在早期 AD 患者与 NC 受试者的分类中,获得了 94.74% 的曲线下面积(AUC)分数、100% 的灵敏度和 89.47% 的特异度,显示出比使用结构 MRI 更有前景的早期痴呆检测性能。
从 DeepMRS 的超参数生成的 CAM 可以提供关键信息,突出信号中与区分 AD 和 NC 相关的代谢物。对于输出类 c,其对应的 CAM 计算如下:
[CAM_{MRS}=\sum_{k = 1}^{K}Conv_{k}\cdot w_{k,c}]
其中,(Conv_{k}) 是全局平均池化层之前卷积层的第 k 个特征图,(w_{k,c}) 是与第 k 个特征图和类 c 相关的权重。
通过观察 CAM 可以发现,在 550 至 800 ppm 范围内的代谢物,如含胆碱化合物(Cho)、N - 乙酰天门冬氨酸(NAA)和肌酸(Cr),对区分 AD 和 NC 组最为重要,这与临床标准一致。同时,模型将信号噪声伪影(如 500 ppm 左右的水信号高峰)视为无关特征,通过在相应的 ppm 范围内赋予负值来体现。
以下是使用 CAM 研究 AD 的步骤总结:
1. 选择合适的医学成像模态(如 PET、MRI、MRS)。
2. 构建相应的 CNN 模型(如 3D CNN、DeepMRS 等)。
3. 训练模型并生成 CAM。
4. 分析 CAM 以确定对诊断重要的区域或代谢物。
4. 深度学习在乳腺癌识别中的应用
4.1 乳腺癌的描述
乳腺癌主要有两种类型的病变:微钙化和肿块。这里主要关注乳腺肿块,肿块是占据一定空间的重要不透明区域,在两个不同投照角度下可见。若仅在一个投照角度观察到,则称为不对称,直到确认其三维性质。
专家通常通过形状、轮廓和密度等特征来描述肿块,以确定其性质。以下是一些不同的乳腺癌描述方法及其效果:
|方法|描述|分类准确率|
| ---- | ---- | ---- |
|[BLB90]|使用基于模糊金字塔的多分辨率方法分割图像中的肿块,提取形状和纹理描述符,用于四级层次分类模型|85%(25 张图像数据集)|
|[REFDA97]|提出基于矩的形状描述符,根据肿块轮廓像素密度表征感兴趣区域与肿块的过渡|94.9%|
|[GRCS07]|基于肿块轮廓的多边形模型描述肿块,保留毛刺和重要诊断细节,提取毛刺描述符|94%|
|[NR12]|使用 Krawtchouk 矩作为输入,用于 kNN 分类器,并与 Zernike 矩进行比较|Krawtchouk 矩 93%,Zernike 矩 85%|
|[KDM12]|提出三种形态描述符:骨骼端点(SEP)、突起选择(PS)和毛刺状肿块描述符(SMD)|SEP 92%,PS 93%,SMD 97%|
4.2 深度学习与乳腺癌数据库
4.2.1 深度学习架构
卷积神经网络(CNNs)是深度学习中非常出色的方法,能够在数百万图像的大型数据集上表现出高泛化能力。其特殊的架构考虑了计算机视觉领域中二维图像的特定拓扑结构,通过限制隐藏单元的感受野来关注局部变化,从而学习局部连接方案。随着卷积层的堆叠,网络能够学习更抽象、更具判别性的高级表示。
在乳腺癌识别中,由于乳腺摄影数据集规模较小,选择预训练的 CNN(如 AlexNet)进行无监督特征提取是更合适的选择。AlexNet 是第一个现代 CNN 模型,其组成和工作方式如下:
1.
图像预处理
:对图像进行平移和水平翻转,随机提取 224×224 大小的图像块作为学习数据库,并通过向图像主成分添加噪声来改变 RGB 颜色通道的强度,以确保对光照和颜色的不变性。
2.
网络层结构
:包含八个层,其中五个卷积层和三个全连接(FC)层。第一和第二个卷积层后接归一化和最大池化层,最后三个卷积层相互连接,无归一化和池化操作。
3.
激活函数和技巧
:使用 ReLU 激活函数,显著减少训练时间;采用局部标准化,便于泛化;使用重叠子采样技术,降低学习误差率。
在乳腺癌识别中,采用三层决策方法:
1.
第一步
:将 AlexNet 应用于感兴趣区域(ROIs),无监督地提取可用于决策的高级描述符。
2.
第二步
:将 AlexNet 应用于分割后的图像,提取与学习数据库中不同肿块相关的形状和轮廓描述符。
3.
第三步
:使用 AlexNet 的第二个全连接层(FC7,包含 4096 个神经元)作为描述符层,将这些描述符输入到支持向量机(SVM)分类器中构建学习模型,用于分类和识别肿块为良性或恶性,为决策提供支持。
对于毛刺,鉴于其形状、密度和类型的随机性,让放射科医生判断其在决策中的相关性。通过分割可以帮助放射科医生关注真正的感兴趣结构,消除可能造成混淆的因素。
4.2.2 乳腺癌数据库
为了建立乳腺肿块分类器,使用了一个数据集,并将其分为三个不同的分区:
|分区|作用|
| ---- | ---- |
|DBtrain|用于训练模型以调整参数|
|DBvalid|用于选择超参数|
|DBtest|用于测试模型性能|
4.3 乳腺癌识别流程
graph LR
A[获取乳腺图像] --> B[图像预处理]
B --> C[分割图像]
C --> D[应用 AlexNet 到 ROIs]
D --> E[提取高级描述符]
C --> F[应用 AlexNet 到分割后图像]
F --> G[提取形状和轮廓描述符]
E --> H[使用 FC7 作为描述符层]
G --> H
H --> I[SVM 分类器训练]
I --> J[分类肿块为良性或恶性]
J --> K[放射科医生确认或否定诊断]
综上所述,可解释人工智能在医学影像领域具有重要的应用价值。在高级别胶质瘤预测、阿尔茨海默病诊断和乳腺癌识别等方面,通过合适的模型和技术(如 CAM、CNN 等),可以提高诊断的准确性和可解释性,为医疗决策提供有力支持。同时,确保模型的安全性和鲁棒性,使其决策依据与领域知识相匹配,是推动人工智能在医学领域广泛应用的关键。
超级会员免费看

被折叠的 条评论
为什么被折叠?



