基于分布随机化的二维医学图像分割多源领域泛化方法
在计算机辅助诊断中,医学图像分割是一项至关重要的任务。卷积神经网络(CNNs)在该任务上展现出了显著的效果,但在实际临床应用中,由于不同医疗中心的扫描仪和成像协议不同,导致医学图像质量差异大,出现领域偏移问题,使得在训练数据(源领域)上训练的CNN模型难以在未见过的测试数据(目标领域)上有良好的泛化能力。为解决这一问题,领域泛化(DG)方法应运而生,本文聚焦于多源DG方法。
1. 现有DG方法的局限性
多数DG研究尝试通过标准化特征和/或向网络添加额外结构来缓解分布差异。然而,标准化特征可能导致过度标准化,阻碍网络保留语义内容;添加额外结构在估计源领域和目标领域数据之间的距离时可能引入过多误判风险。
近期,通过领域随机化模拟未见过的目标领域数据分布成为DG研究的主流方向。领域随机化可在输入空间或特征空间进行。在输入空间进行时,虽易于评估扰动图像的质量,但通常需要领域知识和专业技能;在特征空间进行时,由于缺乏可视化,难以监控特征空间中语义内容的扰动程度。
一些基于特征空间领域随机化的方法,如MixStyle、EFDM、DSU等,虽有一定改进,但使用源领域数据的统计信息进行特征扰动可能限制搜索空间,难以在特征风格空间中均匀探索,且缺乏对原始特征的参考,无法明确学习领域不变表示。
2. 提出的TriD方法
为解决上述问题,本文提出了一种简单而有效的多源DG方法——Treasure in Distribution(TriD),它包含两个主要步骤:统计随机化(SR)和风格混合(SM)。
2.1 预备知识
设 $f \in R^{B×C