【论文阅读笔记】Multimodal Transformer of Incomplete MRI Data for Brain Tumor Segmentation

最新推荐文章于 2025-11-25 10:44:32 发布

原创

最新推荐文章于 2025-11-25 10:44:32 发布 · 1.3k 阅读

·

22

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#论文阅读 #笔记 #transformer

本文提出了一种基于多模态Transformer的脑肿瘤分割模型，利用U-Net结构，通过模态专用编码器处理每个模态的特征，多模态Transformer学习缺失模态，共享权重解码器融合多模态特征。实验在BraTS数据集上展示了其性能，但方法对模态信息依赖性及训练数据完整性有局限性。

Ting H, Liu M. Multimodal Transformer of Incomplete MRI Data for Brain Tumor Segmentation[J]. IEEE Journal of Biomedical and Health Informatics, 2023. 【代码开源】

论文概述

本文提出了一种基于多模态Transformer网络的不完全多模态MRI数据的脑肿瘤分割方法。该网络基于U-Net体系结构，由模态专用编码器、多模态Transformer和多模态共享权重解码器组成。首先，构建一个卷积编码器来提取每个模态的具体特征。然后，提出一种多模态Transformer来建模多模态特征的相关性，并学习缺失模态的特征。最后，提出一种多模态共享权重解码器，将多模态和多级特征与空间和通道自注意模块逐步聚合，用于脑肿瘤分割。

网络结构

Modality specific feature learning

这一步类似MMFormer，每个模态单独编码，然后使用类似dropout机制随机丢弃一些模态来模拟缺失模态。网上有很多关于MMFormer的解读，不再赘述。与MMFormer不同在于，在每个模态的每个特征提取层级都进行了特征拼接和dropout。具体如下：文中定义 $S P_{m, k}$ 为编码器从第 $m$ 个模态中提取的第 $k$ 个级别特征，其中 $\in\{1,2,3,4\}$ ,对应MRI中的四个模态 $\{\text { Flair }, T 1, T 2, T 1 c\}$ ,进行对应特征拼接后得到四种模态在各个层级的特征拼接： $P_{k}=\left[S P_{1, k}, S P_{2, k}, S P_{3, k}, S P_{4, k}\right]$

最低0.47元/天解锁文章

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。