【语义分割系列：七】Attention Unet 论文阅读翻译笔记医学图像 python实现

最新推荐文章于 2025-10-10 11:30:01 发布

原创

最新推荐文章于 2025-10-10 11:30:01 发布 · 置顶 · 2.7w 阅读

·

29

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#Attention #Unet #Attention Unet #segment #Attention U-Net: Learning Where to

本文介绍了Attention U-Net模型，该模型基于U-Net并引入了注意力门控（Attention Gates）机制，提高了对前景像素的敏感度，尤其在医学图像分割任务中表现优秀。通过在解码器部分应用Attention Gates，模型能够学习关注局部区域，减少不相关背景的影响，从而提升图像分割的准确性。相比于多阶段CNNs和硬注意力方法，Attention U-Net具有更少的额外参数，且训练过程无需复杂的强化学习。

部署运行你感兴趣的模型镜像

Attention U-Net

2018 CVPR
Ozan Oktay, Jo Schlemper, Loic Le Folgoc, Matthew Lee

Attention U-Net: Learning Where to Look for the Pancreas

1、Introduce

什么是attention？

Attention 即为注意力机制，举例就是在复杂场景文字识别中，使用Attention把注意力集中在需要识别的数字上。
在医疗图像中，就是把注意力集中到对特定任务有用的显著特征（比如说相关组织或者是器官），抑制输入图像中的不相关区域。在级联神经网络中，需要明确的外部组织/器官定位模块，而使用Attention就不需要了。

论文中是以U-net为基础进行集成，在decoder部分使用了Attention Gates ，得到了Attention U-Net模型。实验表明，融入AG后，Unet模型的精度更高了。

本文提出的 Attention

提出了grid-based gating ，使attention coefficients 更具体到局部区域。
在一个 feed-forward CNN模型中使用soft-attention技术
提出的attention gate可以替代图像分类中使用的注意方法和图像分割框架中使用的外部器官定位模型。
提高模型对 foreground 像素的敏感度

FCN （Fully Convolutional Network）优于传统方法是因为：

(I) 利用随机梯度下降(SGD)优化学习域特定图像特征
(II) 学习的核在所有像素之间共享
(III) 图像卷积操作很好地利用了医学图像中的结构信息

cascaded CNNs方法：

an initial coarse-level model (e.g. U-Net or Regression Forest) is used to obtain a ROI
then a cropped ROI is used for segmentation refinement by a second model.
dense connections
sparse convolutions

您可能感兴趣的与本文相关的镜像

Dify

Dify

AI应用

Agent编排

Dify 是一款开源的大语言模型（LLM）应用开发平台，它结合了后端即服务(Backend as a Service) 和LLMOps 的理念，让开发者能快速、高效地构建和部署生产级的生成式AI应用。它提供了包含模型兼容支持、Prompt 编排界面、RAG 引擎、Agent 框架、工作流编排等核心技术栈，并且提供了易用的界面和API，让技术和非技术人员都能参与到AI应用的开发过程中

最低0.47元/天解锁文章

鹿鹿最可爱

博客等级

码龄10年

120
原创

425
点赞

1921
收藏

6855
粉丝

关注

私信

分类专栏

展开全部收起

上一篇：: IOU(Intersection Over Union) 概念清晰图解 + python代码示例

下一篇：: 【医学+深度论文：F02】Glaucoma diagnosis based on both hidden features and domain knowledge through deep

最新文章

AI算力推荐

Dify

Dify 是一款开源的大语言模型（LLM）应用开发平台，它结合了后端即服务(Backend as a Service) 和LLMOps 的理念，让开发者能快速、高效地构建和部署生产级的生成式AI应用。它提供了包含模型兼容支持、Prompt 编排界面、RAG 引擎、Agent 框架、工作流编排等核心技术栈，并且提供了易用的界面和API，让技术和非技术人员都能参与到AI应用的开发过程中

AI应用

Agent编排

目录

展开全部

收起

评论 29

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。