【论文阅读笔记】MMMViT: Multiscale multimodal vision transformer for brain tumor segmentation with missing m

本文介绍MMMViT,一种针对脑肿瘤分割中缺失模态问题的新方法,通过多尺度特征提取和模态间相关性建模,改进了mmFormer,实现在BraTS2018数据集上显著提高分割准确率。

Qiu C, Song Y, Liu Y, et al. MMMViT: Multiscale multimodal vision transformer for brain tumor segmentation with missing modalities[J]. Biomedical Signal Processing and Control, 2024, 90: 105827.【代码开源】

【论文概述】

本文介绍了一种名为多尺度多模态视觉变换器(MMMViT)的新方法,用于解决脑肿瘤分割中缺失模态的问题。MMMViT 利用跨模态之间的相关性,将直接融合可用模态特定特征到共享潜在空间的过程分解为两个简单步骤,以降低学习共享潜在表示的难度。此外,该方法通过卷积编码器为每种模态提取的局部多尺度特征,输入到模态内部的变换器块中,从而隐式捕获全局多尺度特征,以适应不同大小的脑肿瘤。MMMViT 在 BraTS 2018 数据集上的验证结果表明,该方法不仅在大多数输入案例中优于现有的 mmFormer 方法,而且还提高了采用所有模态输入的变换器相关脑肿瘤分割方法的 Dice 相似系数(DSC)准确率。

【Introduction部分概述】

在本文的引言部分中,作者讨论了解决脑肿瘤分割中缺失模态问题的几种方法,具体包括利用生成模型合成缺失模态和学习共享的潜在空间表示。以下是这些方法的总结,包括每种方法的优缺点

  • 利用生成模型合成缺失模态

    • 优点:可以从可用的模态中合成缺失的模态,使得可以使用所有模态进行分割。

    • 缺点:增加了额外的计算成本和人工中间步骤,且分割准确性极大地依赖于合成模态的质量。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值