【论文阅读笔记】MOSformer: MOmentum Encoder-based Inter-Slice Fusion Transformer for Medical Image Segmentat

本文介绍了一种新型深度学习模型MOSformer,通过双编码器设计和动量更新机制改进医学图像分割。特别地,IF-Swin模块增强了切片间的特征融合。实验结果显示,MOSformer在Synapse、ACDC和AMOS数据集上表现出色,达到85.63%、92.19%和85.43%的DSC分数。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

arxiv Jan22 ,2014

【核心思想】

提出了一种新型的用于医学图像分割的深度学习模型MOSformer。它主要通过双编码器设计和动量更新方法来提高2.5D医学图像分割模型的性能,其中一个编码器使用动量更新保持切片表示的一致性。此外,它还引入了一种名为IF-Swin的变换器模块,通过在切片维度扩展窗口自注意力机制,实现多尺度特征图之间的有效融合。

【网络结构与关键特点】

image-20240124101135867
  1. 双编码器设计

    • 设计动机:传统的2.5D基于单编码器的模型在处理输入切片时,往往无法有效区分每个切片的特征。这是因为所有切片都通过同一个编码器处理,导致它们具有相同的特征分布,从而限制了模型捕捉目标切片特征的能力。一个简单的想法是使用两个独立更新的编码器分别处理邻近切片和目标切片。然而,这种方法在作者实验中取得了次优的性能,作者认为是由于两个独立更新的编码器降低了切片特征的一致性所导致的,因此引出了动量更新方式保持一致性。
    image-20240124101319922
    • 动量更新机制:在双编码器设计中,一个编码器( θ 1 \theta_1 θ

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值