频域自注意力机制与莱姆病病变分割新方法
在医学图像分析领域,高效准确的图像分割技术一直是研究的重点。本文将介绍两种创新的技术:频域中的Hartley多头注意力机制(HartleyMHA)用于3D图像分割,以及EdgeMixup方法用于莱姆病病变分割和诊断公平性的提升。
频域中的Hartley多头注意力机制
在构建基于某些公式的模型时,即便使用较小的 $k_{max}$ (例如 (14, 14, 10)),模型也会有多达数千万的参数。为了简化计算并减少参数数量,我们采用共享的 $\hat{R}$ 来替代每个 $k$ 处使用不同的 $\hat{R}(k)$,公式如下:
$H (K_{ut}) (k) = \hat{R} \hat{U}_{t}(k)$
这等同于在频域中应用一个核大小为1的卷积层。使用该公式能在不影响准确性的前提下,简化计算并大幅减少参数数量。
Hartley多头注意力(MHA)
由于公式中使用的是实数而非复数,因此可以在频域中应用多头注意力机制进行高阶特征组合。对于图像分割任务,$k_{max}$ 通常远小于图像尺寸,这使得序列长度(体素数量)能够大幅减少。通过特定公式可计算自注意力的查询、键和值矩阵($Q$、$K$、$V$):
$Q = \bar{U} {t} \hat{R} {Q}^{T}$
$K = \bar{U} {t} \hat{R} {K}^{T}$
$V = \bar{U} {t} \hat{R} {V}^{T}$
其中,$\bar{U} {t} \in R^{N