38、基于快速神经影像的阿尔茨海默病检索与分析框架

基于快速神经影像的阿尔茨海默病检索与分析框架

1. 引言

神经影像数据在神经退行性疾病分析中具有重要价值。例如,磁共振(MR)图像能够清晰显示大脑不同软组织,为我们提供神经退行性病变导致的脑萎缩等重要信息,且具有无创、安全的优点。因此,众多研究利用 MR 图像来识别阿尔茨海默病(AD)及其相关疾病阶段的生物标志物。

然而,传统的基于神经影像数据(如 MR 图像)的 AD 诊断方法,像基于感兴趣区域(ROI)的方法和基于体素的方法,在进行进一步分析之前,需要进行耗时的非线性配准过程,将所有图像配准到同一公共空间。例如,某些经典工作中的非线性配准时间成本较高,这使得传统方法在临床实时神经影像分析中不切实际。此外,临床医生不仅关注预测分类标签,还希望检索每个新患者的相似病例以辅助诊断,但传统方法往往只能提供诊断标签预测。

为解决上述问题,本文提出了一种基于快速神经影像的检索和 AD 分析框架,该框架包含三个关键要素:
- 地标检测:避免了传统 ROI 方法和体素方法在测试阶段所需的耗时非线性配准过程。
- 地标选择:通过提出一种新的特征选择方法,去除冗余或有噪声的地标。
- 哈希处理:将每个患者的高维特征向量转换为短二进制代码,以便高效进行近似最近邻搜索和 AD 诊断。

2. 提出的框架

该框架包括训练阶段和测试阶段两个阶段,具体流程如下:

graph LR
    classDef startend fill:#F5EBFF,stroke:#BE8FED,stroke-width:2px
    classDef process fill:#E5F6FF,stroke:#73A6FF,stroke-width:2px
    classDef decision fill:#FFF6CC,stroke:#FFBC52,stroke-width:2px

    A([开始]):::startend --> B(训练阶段):::process
    B --> C(地标检测):::process
    C --> D(地标选择):::process
    D --> E(哈希处理):::process
    E --> F(测试阶段):::process
    F --> G(地标检测):::process
    G --> H(去除冗余地标):::process
    H --> I(提取特征):::process
    I --> J(计算 PR 向量和实值代码):::process
    J --> K(二值化代码):::process
    K --> L(计算汉明距离):::process
    L --> M(多数投票确定标签):::process
    M --> N([结束]):::startend

2.1 地标检测

采用特定方法定义 MR 图像中与 AD 相关的地标,并构建基于回归森林的地标检测模型。具体步骤如下:
1. 将所有训练 MR 图像非线性配准到模板图像,识别两组(AD 和正常对照)之间局部形态特征显著不同的体素作为地标。
2. 通过非线性配准估计的变形场,将模板中的地标映射到训练图像,得到所有训练图像的地标。
3. 利用检测到的地标构建基于回归森林的地标检测模型,以患者体素的低能量模式(LEP)特征及其与检测到的地标的相应位移作为模型的输入和输出。

这些耗时的过程在离线完成,在测试阶段,使用学习到的地标检测模型查找测试 MR 图像的地标,无需进行非线性配准或回归森林训练,速度极快。

2.2 地标选择

地标检测后,由于地标数量众多,每个地标又有多个特征,导致每个患者的特征总数非常高,而可用患者数量较少,存在“高维低样本量”(HDLSS)问题,使得传统机器学习技术(如支持向量机)不稳定。此外,检测到的地标可能存在冗余或对分类器无区分性。因此,需要进行地标选择以去除冗余和有噪声的地标。

为此,提出了一种将子空间学习和二维特征选择集成在统一框架中的新地标选择方法。具体步骤如下:
1. 将每个患者的所有地标特征向量并排排列,形成二维特征矩阵,以保留地标之间的空间信息,有助于识别冗余和有噪声的地标。
2. 将地标的高维 LEP 特征转换为类似目标(即临床状态)的特征,并联合选择所有患者的有区分性的地标。

设第 i 个患者的特征矩阵为 $X_i \in R^{l \times d}$,其中 l 是地标数量,d 是每个地标 LEP 特征的维度。第 i 个患者的相应临床状态表示为 $y_i \in R^{c \times 1}$,其中 c 是可能的临床状态数量。假设 $X_i$ 和 $y_i$ 之间存在线性关系,且有 n 个患者,地标检测算法可表示为:
$$
\min_{S,R} \sum_{i=1}^{n} |y_i^T - s_i^T X_i R| F^2 + \gamma |S| {2,1}, \text{ s.t., } R^T R = I
$$
其中,$S = [s_1, …, s_n] \in R^{l \times n}$ 和 $R \in R^{d \times c}$ 是系数矩阵,$\gamma$ 是调整参数。$s_i \in R^{l \times 1}$ 是稀疏向量,用于选择第 i 个患者的地标,并将所选地标线性组合成单个向量。通过组稀疏正则化器($l_{2,1}$ - 范数)鼓励 S 中的全零行,以联合选择所有患者的有区分性的地标。

满足最优条件后,可通过 S 中的非零行获得所选地标的索引。

2.3 哈希处理

地标选择后,每个患者的特征仍然是高维的,难以训练稳定的分类器。此外,除了分类任务,还希望高效检索相似患者以辅助 AD 分析。哈希处理可以将高维数据转换为短二进制代码,同时尽可能保留原始数据空间中患者之间的邻域关系。

采用特定的哈希框架,包括两个关键步骤:
- 概率表示 :将高维数据用低维概率表示,以解决 HDLSS 问题并保留数据的局部结构。具体步骤如下:
1. 将特征矩阵 $\tilde{X}$ 划分为 m 个聚类。
2. 计算每个患者属于每个聚类的概率,通过计算患者与聚类质心的欧几里得距离。
3. 保留概率向量中前几个最大概率,将其余小概率设为 0,得到稀疏的概率表示向量 $\tilde{p} i$。
- 哈希函数学习 :使用字典对所有患者的概率表示进行编码,并将编码系数二值化为最终的哈希码。具体步骤如下:
1. 定义目标函数:
$$
\min
{\Phi,\Lambda} |\tilde{P} - \Phi \Lambda| F^2 + \lambda \sum {i=1}^{n} |\alpha_i - \mu|^2, \text{ s.t. } |\varphi_j|_2 = 1
$$
其中,$\Phi \in R^{m \times a}$ 是编码字典,$\Lambda = [\alpha_1, …, \alpha_n] \in R^{a \times n}$ 是编码矩阵,$\mu$ 是所有编码向量的均值,$\lambda$ 是调整参数,a 是原子数量或代码长度。
2. 交替优化 $\Phi$ 和 $\Lambda$ 以求解目标函数。首先随机初始化 $\Phi$,求解 $\Lambda$ 得到每个 $\alpha_i$ 的解析解:
$$
\alpha_i = T \tilde{p}_i + \beta
$$
其中,
$$
\begin{cases}
T = (\Phi^T \Phi + \lambda I)^{-1} \Phi^T \
\beta = \lambda (\Phi^T \Phi + \lambda I)^{-1} (\Phi^T \Phi)^{-1} \Phi^T z
\end{cases}
$$
$I$ 是单位矩阵,$z$ 是所有概率表示向量 $\tilde{p}_i$ 的均值。
3. 计算所有 $\alpha_i$ 的均值向量 $\mu$,并将 $\alpha_i$ 二值化:
$$
\begin{cases}
b_i(j) = 1 \text{ if } \alpha_i(j) \geq \mu_i(j) \
b_i(j) = 0 \text{ if } \alpha_i(j) < \mu_i(j)
\end{cases}
$$
将所有二进制代码排列在一起形成哈希矩阵 $B$。

2.4 测试阶段

给定测试患者 $\hat{x}$,具体操作步骤如下:
1. 使用学习到的地标检测模型检测其地标。
2. 通过保留所选地标的索引去除冗余或有噪声的地标。
3. 从所选地标中提取 LEP 特征。
4. 计算相应的概率表示向量和实值代码。
5. 将代码二值化。
6. 计算二值化代码与哈希矩阵 $B$ 之间的汉明距离,找到 $\hat{x}$ 的最近邻患者。
7. 通过多数投票规则集成相邻患者的相关标签,获得 $\hat{x}$ 的分类标签。

3. 实验

为评估提出的框架,使用阿尔茨海默病神经影像倡议(ADNI)数据集的两个不相交子集进行实验。具体如下:
- 训练数据:使用 ADNI - 1 中的 199 例 AD 患者和 229 例年龄匹配的正常对照。
- 测试数据:使用 ADNI - 2 中的 159 例 AD 患者和 201 例年龄匹配的正常对照。

为获得更可靠的结果,对训练数据进行 10 次 10 折交叉验证,每次实验仅使用训练数据的子集(9 折)训练模型,并使用测试数据进行测试。在每个实验中,进行嵌套 5 折交叉验证,在 ${10^{-5}, …, 10^5}$ 的网格搜索范围内确定模型的参数值。

3.1 地标选择实验结果

通过对训练集进行 10 次 10 折交叉验证进行地标选择,根据地标被选择的频率设置不同阈值,选择不同数量的地标。使用所选地标的 LEP 特征训练分类器,并记录平均分类准确率和测试成本(时间)。

地标数量 kNN 分类准确率 SVM 分类准确率 kNN 测试成本(秒) SVM 测试成本(秒)
1741 - - - -
784 - - - -
482 - - - -
116 - - - -
43 - - - -
13 - - - -

从实验结果可知,测试成本与使用的地标数量成正比,而分类准确率在使用约 482 至 784 个地标时达到最大值。综合考虑准确率和测试成本,选择使用 482 个地标来表示每个患者进行下一步实验。

3.2 哈希处理实验结果

将提出的哈希方法与其他先进的哈希方法(如锚图哈希(AGH)、迭代量化(ITQ)、谱哈希(SpH)和局部敏感哈希(LSH))进行比较,评估其 AD 诊断性能。

方法 代码长度 分类准确率 测试成本(秒)
kNN - 73.89% 12.86
SVM - 75.83% 3.05
AGH - - -
ITQ - - -
SpH - - -
LSH - - -
提出的方法 - - -

实验结果表明,提出的哈希方法在不同比特长度下的分类准确率始终优于其他比较方法。中等代码长度(28 位至 52 位)的三种哈希方法(AGH、ITQ 和提出的方法)的分类准确率通常优于 kNN 和 SVM,且速度比它们快 100 倍以上。此外,检查所有测试患者的前 10 个最近邻患者的诊断标签是否与测试患者相同,结果显示代码长度为 36 时,大多数哈希方法(包括提出的方法、AGH、ITQ 和 SpH)的平均准确率约为 79.05%,而 kNN 为 68.29%。

综上所述,提出的基于快速神经影像的检索和 AD 分析框架在分类准确率和检索速度方面均优于传统分类方法。未来,将设计新的哈希技术以进一步提高神经影像检索和 AD 分析诊断的性能。

4. 框架优势总结

该框架的优势显著,主要体现在以下几个方面:
- 高效性 :地标检测避免了传统方法中耗时的非线性配准过程,哈希处理将高维特征转换为短二进制代码,使得检索和分析速度大幅提升,至少比传统方法快 100 倍。
- 准确性 :通过地标选择去除冗余和有噪声的地标,提高了分类准确率。实验结果表明,在使用合适数量的地标时,分类准确率达到较高水平,且提出的哈希方法在不同比特长度下的分类准确率始终优于其他比较方法。
- 实用性 :不仅可以提供诊断标签预测,还能检索每个新患者的相似病例,辅助临床医生进行诊断,更符合临床实际需求。

5. 应用场景与展望

该框架在临床和研究领域具有广泛的应用场景:
- 临床诊断 :帮助医生快速准确地诊断阿尔茨海默病,提高诊断效率和准确性,为患者提供及时的治疗方案。
- 疾病研究 :用于研究阿尔茨海默病的发病机制、进展过程等,为疾病的预防和治疗提供理论支持。

未来,为进一步提高框架的性能,可以从以下几个方面进行改进:
- 哈希技术优化 :设计新的哈希技术,更好地保留数据的局部结构和邻域关系,提高检索和分类的准确性。
- 多模态数据融合 :结合其他模态的神经影像数据(如 PET、fMRI 等),提供更全面的信息,提高诊断的准确性。
- 模型泛化能力提升 :在更多的数据集上进行验证和优化,提高模型的泛化能力,使其在不同的人群和数据集中都能取得良好的效果。

6. 总结

本文提出的基于快速神经影像的检索和 AD 分析框架,通过地标检测、地标选择和哈希处理三个关键步骤,有效解决了传统方法在实时神经影像分析中的问题。实验结果表明,该框架在分类准确率和检索速度方面均优于传统分类方法,具有较高的实用价值和应用前景。未来的研究可以进一步优化框架,提高其性能,为阿尔茨海默病的诊断和治疗提供更有力的支持。

以下是该框架的主要步骤和优势的总结表格:
| 步骤 | 操作 | 优势 |
| ---- | ---- | ---- |
| 地标检测 | 离线构建回归森林模型,测试阶段快速检测地标 | 避免非线性配准,实现实时分析 |
| 地标选择 | 提出新方法去除冗余和有噪声的地标 | 解决 HDLSS 问题,提高分类稳定性 |
| 哈希处理 | 将高维特征转换为短二进制代码 | 高效检索相似病例,提高分析速度 |

最后,我们可以用一个 mermaid 流程图来展示整个框架的核心流程:

graph LR
    classDef startend fill:#F5EBFF,stroke:#BE8FED,stroke-width:2px
    classDef process fill:#E5F6FF,stroke:#73A6FF,stroke-width:2px
    classDef decision fill:#FFF6CC,stroke:#FFBC52,stroke-width:2px

    A([输入 MR 图像]):::startend --> B(地标检测):::process
    B --> C(地标选择):::process
    C --> D(哈希处理):::process
    D --> E(检索相似病例):::process
    E --> F(诊断分类):::process
    F --> G([输出诊断结果]):::startend

通过以上的分析和总结,我们可以看到该框架在阿尔茨海默病的分析和诊断中具有重要的价值和潜力。希望未来能有更多的研究和应用,推动该领域的发展。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值