【论文阅读笔记】Multimodal Transformer of Incomplete MRI Data for Brain Tumor Segmentation

本文提出了一种基于多模态Transformer的脑肿瘤分割模型,利用U-Net结构,通过模态专用编码器处理每个模态的特征,多模态Transformer学习缺失模态,共享权重解码器融合多模态特征。实验在BraTS数据集上展示了其性能,但方法对模态信息依赖性及训练数据完整性有局限性。

Ting H, Liu M. Multimodal Transformer of Incomplete MRI Data for Brain Tumor Segmentation[J]. IEEE Journal of Biomedical and Health Informatics, 2023. 【代码开源】

论文概述

本文提出了一种基于多模态Transformer网络的不完全多模态MRI数据的脑肿瘤分割方法。该网络基于U-Net体系结构,由模态专用编码器、多模态Transformer和多模态共享权重解码器组成。首先,构建一个卷积编码器来提取每个模态的具体特征。然后,提出一种多模态Transformer来建模多模态特征的相关性,并学习缺失模态的特征。最后,提出一种多模态共享权重解码器,将多模态和多级特征与空间和通道自注意模块逐步聚合,用于脑肿瘤分割。

网络结构

image-20231129102118463
  • Modality specific feature learning

    这一步类似MMFormer,每个模态单独编码,然后使用类似dropout机制随机丢弃一些模态来模拟缺失模态。网上有很多关于MMFormer的解读,不再赘述。与MMFormer不同在于,在每个模态的每个特征提取层级都进行了特征拼接和dropout。具体如下:文中定义 S P m , k S P_{m, k} SPm,k为编码器从第 m m m个模态中提取的第 k k k个级别特征,其中 m ∈ { 1 , 2 , 3 , 4 } m \in\{1,2,3,4\} m{ 1,2,3,4},对应MRI中的四个模态 {  Flair  , T 1 , T 2 , T 1 c } \{\text { Flair }, T 1, T 2, T 1 c\} {  Flair ,T1,T2,T1c},进行对应特征拼接后得到四种模态在各个层级的特征拼接: S P k = [ S P 1 , k , S P 2 , k , S P 3 , k , S P 4 , k ] S P_{k}=\left[S P_{1, k}, S P_{2, k}, S P_{3, k}, S P_{4, k}\right] SPk=

### 关于用于未对齐多模态语言序列的多模态Transformer模型 #### 多模态Transformer (MulT) 的设计原理 多模态Transformer (MulT) 是一种专门针对未对齐的多模态语言序列而设计的架构。该模型旨在处理不同形式的数据输入,如文本、音频和视频,并通过跨模态注意力机制实现这些数据的有效融合[^1]。 #### 跨模态注意力机制 在高层次上,MulT 采用来自多个方向成对的跨模态Transformer来进行前馈融合过程。每个跨模态Transformer负责学习两种模态特征间的相互作用,即通过计算它们之间的重要性权重来增强目标模态的信息表示。这一过程中,较低层次的特征被用来不断加强较高层次的目标模态表达,从而使得最终得到的表征更加鲁棒且具有更强的表现力[^2]。 #### 序列建模与预测 完成上述跨模态交互之后,所获得的融合特征会被送入到一个基于自注意力机制的序列模型中进一步加工。此阶段的任务是对之前产生的综合特征执行更深层次的理解以及做出相应的分类或其他类型的决策支持。整个流程不仅能够有效应对各种复杂的实际应用场景下的挑战,同时也为后续研究提供了新的思路和技术手段[^3]。 ```python import torch.nn as nn class MultiModalTransformer(nn.Module): def __init__(self, config): super().__init__() self.cross_modal_transformers = nn.ModuleList([ CrossModalAttention(config), ... ]) def forward(self, inputs): fused_features = [] for transformer in self.cross_modal_transformers: output = transformer(inputs) fused_features.append(output) final_output = combine_fused_features(fused_features) return final_output ```
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值