超越自注意力:用于医学图像分割的可变形大核注意力

本文提出了一种可变形大核注意力(D-LKA)机制,用于解决医学图像分割中计算需求高和局部信息丢失的问题。D-LKA能够在保持计算效率的同时,利用可变形卷积捕捉形变,增强对3D体积数据的理解。通过2D和3D版本的D-LKA Net,模型在Synapse、NIH Pancreas和Skin lesion数据集上展现出优越性能,尤其是在小器官分割上。消融实验验证了可变形层和跳层连接的重要性,D-LKA网络为医学图像分割提供了新的解决方案。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

摘要

医学图像分割在采用transformer模型方面取得了显着的改进,这些模型在掌握深远上下文和全局上下文信息方面表现出色。然而,这些模型的计算需求不断增加,与token数量的平方成正比,限制了它们的深度和分辨率能力。当前大多数方法都是将D体积图像数据处理为逐层(称为伪3D),这会丢失关键的层间信息,从而降低模型的总体性能。为了解决这些挑战,我们引入了可变形大核注意力(D-LKA Attention)的概念,这是一种采用大卷积核的简化注意力机制,用于充分理解体积上下文。该机制在类似于自注意力的感受野内运行,同时避免了计算开销。此外,我们提出的注意力机制得益于可变形卷积,可以灵活地扭曲采样网格,使模型能够适当地适应不同的数据模式。我们设计了D-LKA Attention的2D和3D版本,其中后者在跨深度数据理解方面表现出色。这些组件共同构成了我们新的层次化Vision Transformer架构,即D-LKA Net。在流行医学分割数据集(Synapse、NIH Pancreas和Skin lesion)上对模型进行评估证明了其卓越的性能。我们的代码实现在https://github.com/mindflow-institue/deformableLKA上公开可用。

1、简介

医学图像分割在计算机辅助诊断中起着至关重要的作用,它可以帮助医学专业人员分析复杂的医学图像。这个过程不仅减少了手动任务的繁琐程度和对医学专业知识的依赖,还能实现更快更准确的诊断。自动分割提供了更快更准确的诊断结果的可能性,从而促进了适当的治疗策略的实施,并使得图像引导手术程序得以实现。因此,开发快速且精确的分割算法的必要性成为推动这一研究的

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

AI智韵

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值