
Mamba
文章平均质量分 94
CVHub
专注多模态视觉语言AI全栈知识分享,提供原创、多领域、有深度的前沿AI论文解读与工业成熟解决方案
展开
-
UltraLight-VM-UNet
首先我们先来看下整体架构。UltraLight VM-UNet模型采用了U形的结构,这种结构通常包含一个编码器(用于提取图像特征)和一个解码器(用于根据提取的特征重建分割图)。模型的特点是其通道数设置为[8, 16, 24, 32, 48, 64],这样的设计有助于在不同层次上捕捉图像的细节和上下文信息。模型的前三层使用传统的卷积模块来提取浅层特征,而后三层则采用了作者提出的Parallel Vision Mamba Layer(PVM Layer)来提取更深层次的特征。原创 2024-04-05 22:14:36 · 1093 阅读 · 0 评论 -
Mamba入局遥感图像分割 | Samba: 首个基于SSM的遥感高分图像语义分割框架
本文介绍了Samba,一种基于Mamba的高分辨率遥感图像语义分割框架,标志着Mamba在该领域的首次应用。通过在LoveDA数据集上性能的评估,Samba超越了最先进的CNN-based和ViT-based的方法,设定了新的性能基准,并展示了Mamba架构在高分辨率遥感影像语义分割中的有效性和潜力。如果你对本文有任何的观点或疑问,欢迎评论区下方留言讨论。同时也欢迎对前沿AI技术感兴趣的同学扫添加微信好友: cv_huber,备注“交流学习”即可。原创 2024-04-05 22:13:38 · 1850 阅读 · 0 评论 -
LocalMamba
在本文中,作者介绍了LocalMamba,一种新的视觉状态空间模型,它显著增强了对图像局部依赖关系的捕捉能力,同时保持了全局上下文理解。作者的方法利用了窗口化选择性扫描和扫描方向搜索,取得了显著优于现有模型的效果。在多个数据集和任务上的广泛实验已经证明了LocalMamba相较于传统卷积神经网络(CNN)和视觉 Transformer(ViTs)的优越性,为图像分类、目标检测和语义分割建立了新的基准。作者的研究强调了扫描机制在视觉状态空间模型中的重要性,并为高效和有效的状态空间建模研究开辟了新的途径。原创 2024-04-01 23:30:16 · 1018 阅读 · 0 评论 -
LMa-UNet: 探索大kernel Mamba在医学图像分割上的潜力
本文首次探索了大kernel(window) Mamba块在医学图像分割上的潜力,为了充分利用大kernel Mamba的能力,我们设计了一种基于分层和双向的大window的Mamba块,增强SSM的表示建模能力。通过分层设计即PiM和PaM同时建模全局和局部关系,并结合UNet进行高效的医学图像分割。在多个器官数据集上的实验表明,大kernel(window) Mamba在医学图像分割任务中具有竞争力,并值得未来深入探索。最后,如果你对本文有任何的观点或疑问,欢迎评论区下方留言讨论。原创 2024-04-01 23:18:51 · 1665 阅读 · 0 评论