阅读时间:2024/08/26
名字:Diff-UNet: A Diffusion Embedded Network for Volumetric Segmentation
Summary
这篇文章提出了一种创新的3D医学图像分割框架,Diff-UNET。主要分为三个模块,Label Embedding标签嵌入技术,Denoising Module去噪模块和Step-Uncertainty based Fusion。通过标签嵌入技术处理多类别分割,去噪模块(Feature Encoder和Denoising Unet(Encoder和Decoder))来提取深度特征,Step-Uncertainty based Fusion(融合权重)来增强模型对不确定性的评估和增强分割鲁棒性.
并通过三个数据集(BraTS2020多模态脑肿瘤分割数据集、BTCV多器官分割数据集和MSD Liver及肿瘤分割数据集)和多个SOTA方法进行比较和消融实验,证明其有效性.
Method(s)
作者解决问题的方法/算法是什么?是否基于前人的方法?基于了哪些?要点和创新点?
- 引入扩散模型进行医学图像分割,提高了预测的鲁棒性。
- 标签嵌入操作允许模型同时分割多个目标。
- 去噪模块结合了特征编码器和去噪UNet来学习去噪过程。
- SUF模块在测试阶段融合多步预测,进一步提升分割精度。
Usefule sentences
leverage
to improve the segmentation robustness of Diff-UNet model, we fuse the output based on the number of prediction steps and uncertainty
DDIM和DDPM有相同的训练目标,但是它不再限制扩散过程必须是一个马尔卡夫链,这使得DDIM可以采用更小的采样步数来加速生成过程,DDIM的另外是一个特点是从一个随机噪音生成样本的过程是一个确定的过程(中间没有加入随机噪音)。
[[Loss Function]]
L t o t a l = L d i c e ( x 0 ^ , x 0 ) + L b c e ( x 0 ^ , x 0 ) + L m s e ( x 0 ^ , x 0 ) . \mathcal{L}_{total}=\mathcal{L}_{dice}(\hat{x_0},x_0)+\mathcal{L}_{bce}(\hat{x_0},x_0)+\mathcal{L}_{mse}(\hat{x_0},x_0). Ltotal=Ldice(x0^,x0)+Lbce(x0^,x0)+Lmse(x0^,x0).
Monte Carlo Dropout VS convolutional [[Dropout 正则化技术]]
蒙特卡洛Dropout是一种在深度学习中评估模型不确定性的方法。它基于贝叶斯理论,通过在模型训练和预测时引入Dropout,使得模型能够表达对其预测的不确定性。
在传统的神经网络中,Dropout作为一种正则化技术,通过随机地关闭一部分神经元来防止模型过拟合。而在蒙特卡洛Dropout中,Dropout不仅在训练过程中使用,在预测时也保持激活。
对于回归任务,不确定性可以通过预测值的方差来表示。对于分类任务,可以通过预测概率的熵来衡量不确定性
AdamW [[Optimizer]]
全肿瘤(WT)
定义:指肿瘤在影像学上所占据的全部区域,涵盖了肿瘤内部所有不同生物学特性的组织成分。
强化肿瘤(ET)
定义:是指在注射造影剂后,肿瘤组织中出现强化表现的区域。
肿瘤核心(TC)
定义:一般是指肿瘤中相对较实体的部分,包含了活跃增殖的肿瘤细胞,同时也可能包含一些坏死区域。TC 不包括肿瘤周围的水肿带。
Aorta:主动脉
Gallbladder:胆囊
Kidney(L):肾脏
Kidney(R):肾脏(L)
Liver:肝脏
Pancreas:胰腺
Spleen:脾
Stomach:胃