A-GCL: 用于诊断神经发育障碍的对抗图对比学习
在精准医疗的领域中,如何准确诊断诸如自闭症谱系障碍(ASD)和注意力缺陷多动障碍(ADHD)等复杂的神经发育障碍,始终是一个亟待解决的难题。传统上,这些诊断依赖于耗时的认知测试和临床专家的主观评估,这些评估不仅耗时费力,还容易受到人为偏差的影响。因此,亟需一种更为高效、客观的诊断方法。
研究动机
随着静息态功能磁共振成像(fMRI)技术的飞速发展,我们能够通过测量大脑区域间的血氧水平依赖(BOLD)信号,来观察认知和情感过程中的功能连接(FC)。这些数据蕴含着丰富的信息,有助于揭示大脑功能连接的异常模式。然而,如何从这些复杂的fMRI数据中提取出有意义的生物标志物,一直是一个未解的难题。
A-GCL方法
为了解决这一挑战,研究者们提出了一种名为A-GCL(对抗图对比学习)的新型图神经网络(GNN)框架。该框架旨在通过对比学习,利用fMRI数据来诊断神经发育障碍。以下是A-GCL方法的关键组成部分:
-
图构建:从fMRI图像中构建图,其中每个节点代表一个大脑区域(ROI),节点之间的边则由皮尔逊相关系数(PCC)计算的平均fMRI时间序列的权重表示。
-
对比学习:A-GCL采用对比学习来提取用于分类的特征。它通过一个可训练的伯努利掩码生成一个边缘删除图,以生成对比学习中的正样本。这一过程迫使模型关注对诊断最为关键的连接。
-
对抗训练:为了进一步提升模型的鲁棒性,A-GCL引入了对抗训练策略。通过动态记忆库增强特征提取过程,收集不同批次中的负样本特征,从而增加训练过程中的负样本多样性。
-
分类与解释:提取的特征用于训练线性分类器(如SVM)以诊断ASD或ADHD。此外,训练的伯努利掩码有助于识别与疾病相关的关键功能连接和大脑区域,为临床应用提供可解释性。
详细的图构建过程:
-
大脑划分:使用大脑图谱(如AAL1、AAL3或Shen268),将大脑划分为若干个ROI。不同的图谱划分的ROI数量不同,例如AAL1有116个ROI,AAL3有166个,而Shen268则有268个。
-
节点特征:每个节点(即ROI)的特征由BOLD信号的低频振幅(ALFF)计算得出。ALFF反映了特定频率范围内的信号功率,是通过傅里叶变换从平均时间序列中计算得到的。
-
边权重:边的权重由两个ROI之间的皮尔逊相关系数(PCC)计算得出。具体来说,对于每对ROI,计算它们平均fMRI时间序列之间的PCC,以衡量它们的同步程度。
-
图表示:最终,图 G = ( V , E ) G = (V, E) G=(V,E) 由节点集 V V V 和边集 E E E 组成。每个节点 v i v_i vi 有特征 x i x_i xi,每条边 ( v i , v j ) (v_i, v_j) (vi,vj) 有权重 a i j a_{ij} aij,表示ROI i i i 和ROI j j j 之间的功能连接强度。
通过上述步骤,我们能够将复杂的fMRI数据转化为图结构,为后续的GNN模型提供输入。这一表示方法不仅捕捉了大脑区域之间的功能连接,还保留了每个区域的特征信息,为深入分析大脑功能提供了坚实的基础。
在数学上,图 G G G 可以表示为:
G = ( V , E , X , A ) G = (V, E, X, A) G=(V,E,X,A)
其中:
- V = { v 1 , v 2 , … , v N } V = \{v_1, v_2, \dots, v_N\} V={v1,v2,…,vN} 表示节点集,每个节点对应一个 ROI。
- E ⊆ V × V E \subseteq V \times V E⊆V×V 表示边集,捕捉 ROI 之间的功能连接。
- X = { x 1 , x 2 , … , x N } X = \{x_1, x_2, \dots, x_N\} X={x1,x2,…,xN} 表示节点特征矩阵,每个 x i x_i xi 包含 ROI i i i 的 ALFF 值。
- A ∈ R N × N A \in \mathbb{R}^{N \times N} A∈RN×N 表示邻接矩阵,其中 A i j A_{ij} Aij 表示 ROI i i i 和 ROI j j j 之间的 PCC。
为了确保数据的一致性,节点特征和边权重均进行了归一化处理:
- 节点特征 X X X 通过减去每个通道的最小值并除以最大值与最小值之差,归一化到 [0, 1] 范围内。
- 边权重 A A A 通过将每个权重除以绝对值的最大值,归一化到 [-1, 1] 范围内。
这种归一化处理有助于模型更有效地学习,避免因特征范围不同而产生偏差。
关键公式及其解释
在A-GCL框架中,损失函数的定义是其核心部分。具体而言,损失函数由以下几部分组成:
-
对比损失:
L contrast ( z , μ ; B ) = 1 ∣ B ∣ ∑ G ∈ B log exp ( sim ( z ( G ) , z ( G ~ ) ) ) ∑ G ′ ∈ B ∖ { G } exp ( sim ( z ( G ) , z ( G ~ ′ ) ) ) \mathcal{L}_{\text{contrast}}(z, \mu; \mathcal{B}) = \frac{1}{|\mathcal{B}|} \sum_{G \in \mathcal{B}} \log \frac{\exp(\text{sim}(z(G), z(\tilde{G})))}{\sum_{G' \in \mathcal{B} \setminus \{G\}} \exp(\text{sim}(z(G), z(\tilde{G}')))} Lcontrast(z,μ;B)=∣B∣1G∈B∑log∑G′∈B∖{G}exp(sim(z(G),z(G~′)))exp(sim(z(G),z(G~)))
其中, sim \text{sim} sim 表示两个向量之间的余弦相似度。该损失函数旨在使来自同一图的特征向量在嵌入空间中彼此靠近,而来自不同图的特征向量则彼此远离。 -
正则化项:
L regularize ( μ ; B ) = 1 ∣ B ∣ M 2 ∑ G ∈ B 1 ⊤ μ ( G ) 1 \mathcal{L}_{\text{regularize}}(\mu; \mathcal{B}) = \frac{1}{|\mathcal{B}| M^2} \sum_{G \in \mathcal{B}} \mathbf{1}^\top \mu(G) \mathbf{1} Lregularize(μ;B)=∣B∣M21G∈B∑1⊤μ(G)1
该正则化项通过最小化所有 μ u v \mu_{uv} μuv 的均值来促进边的删除,从而在图中去除冗余信息。 -
记忆库损失:
L memory ( z , μ ; B , M ) = 1 ∣ B ∣ ∑ G ∈ B log exp ( sim ( z ( G ) , z ( G ~ ) ) ∑ z ′ ∈ M exp ( sim ( z ( G ) , z ′ ) ) \mathcal{L}_{\text{memory}}(z, \mu; \mathcal{B}, \mathcal{M}) = \frac{1}{|\mathcal{B}|} \sum_{G \in \mathcal{B}} \log \frac{\exp(\text{sim}(z(G), z(\tilde{G}))}{\sum_{z' \in \mathcal{M}} \exp(\text{sim}(z(G), z'))} Lmemory(z,μ;B,M)=∣B∣1G∈B∑log∑z′∈Mexp(sim(z(G),z′))exp(sim(z(G),z(G~))
该损失函数利用记忆库 M \mathcal{M} M 中存储的特征来增加负样本的多样性,从而提升模型的泛化能力。
最终的损失函数结合了上述三项:
L
=
L
contrast
+
λ
1
L
regularize
+
λ
2
L
memory
\mathcal{L} = \mathcal{L}_{\text{contrast}} + \lambda_1 \mathcal{L}_{\text{regularize}} + \lambda_2 \mathcal{L}_{\text{memory}}
L=Lcontrast+λ1Lregularize+λ2Lmemory
其中,
λ
1
\lambda_1
λ1 和
λ
2
\lambda_2
λ2 是用于平衡各项贡献的超参数。
实验结果
研究者在三个不同的fMRI数据集上验证了A-GCL——ABIDE I、ABIDE II和ADHD-200——使用三种不同的脑图谱——AAL1、AAL3和Shen268。实验结果表明,A-GCL在分类准确率及其他指标(如AUC、精确度、召回率和F1分数)上显著优于其他GNN方法。实验结果图很好看。
此外,广泛的消融研究验证了A-GCL对图谱选择和模型变化的鲁棒性。解释性结果揭示了与ASD和ADHD密切相关的功能连接和大脑区域,这些区域可以作为进一步理解这些疾病的生物标志物。
结果总结
A-GCL通过利用fMRI数据中的功能连接,为神经发育障碍的诊断提供了一种新的工具。其对抗自监督方法和动态记忆库的结合,使其在诊断准确性方面超越了现有技术。此外,通过识别与疾病相关的关键大脑区域,A-GCL有助于弥合临床诊断与神经生物学基础之间的差距。