Transformer与U-Net的完美融合，模型精确度飙升至99.97%！

最新推荐文章于 2025-04-18 11:28:21 发布

AI科研灵感

最新推荐文章于 2025-04-18 11:28:21 发布

阅读量2k

点赞数 37

文章标签：深度学习前沿论文论文解析 transformer UNet

本文链接：https://blog.youkuaiyun.com/AIzhijie001/article/details/144134213

版权

2024深度学习发论文&模型涨点之——transformer+UNet

Transformer和UNet的结合是一种在医学图像分割领域非常活跃的研究方向。这种结合利用了UNet在保留高分辨率特征和精确定位方面的优势，同时引入了Transformer的自注意力机制，以增强模型对长程依赖关系和空间上下文信息的捕捉能力。

Transformer和UNet的结合在医学图像分割领域展现出强大的潜力，通过融合UNet的精确定位能力和Transformer的自注意力机制，这种混合模型能够有效捕捉全局上下文信息和长程依赖关系，从而提高分割的准确性和效率。

如果有同学想发表相关论文，小编整理了一些transformer+UNet【论文代码】合集，以下放出部分，全部论文PDF版，需要的同学公重号【AI科研灵感】回复“transformer+UNet”即可全部领取

论文精选

论文1：

AFTer-UNet: Axial Fusion Transformer UNet for Medical Image Segmentation

AFTer-UNet：用于医学图像分割的轴向融合变换U型网络

方法

轴向融合变换UNet（AFTer-UNet）：提出了一种结合卷积层和变换器的新型网络结构，以利用轴向轴信息。
轴向融合机制：通过分别计算轴向轴和单切片内的自注意力，然后融合它们以减少计算复杂性。
CNN编码器和解码器：使用2D CN

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

AI科研灵感

关注关注

37
点赞
踩
18

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

Unet 改进：在encoder和decoder间加入TransformerBlock

Henry的博客

01-31

856

TransformerBlock是Transformer模型架构的基本组件，广泛应用于机器翻译、文本摘要和情感分析等自然语言处理任务。TransformerBlock是一个由两个子组件组成的构建块：多头注意力机制和前馈神经网络。这两个组件协同工作，处理和转换输入序列。多头注意力机制负责从输入序列中捕获上下文信息。它通过使用多个注意力头同时关注序列的不同部分来实现这一点。每个注意力头计算每个输入元素相对于其他元素的重要性，使模型能够专注于输入序列的不同方面。然后将前馈神经网络应用于多头注意力机制的输出。

Transformer+UNet，创新结合

YunTM的博客

10-30

1453

模型结构：提出了AFTer-UNet模型，该模型结合了U-Net结构和轴向融合变换器编码器，以融合层内和层间的长距离线索来指导分割。模型结构：提出了ConvWin-UNet模型，该模型结合了UNet架构和基于Swin的W-MSA结构的变换器，并与卷积相结合。模型结构：提出了Dilated-UNet模型，该模型结合了扩张变换器块和U-Net架构，用于准确快速的医学图像分割。模型训练：模型训练时考虑了轴向融合机制，减少了计算复杂度，并在训练过程中采用了dice损失和交叉熵损失的组合。

参与评论您还未登录，请先登录后发表或查看评论

Transformer+Unet到底是谁想出来的点子！用来创新真的绝绝子啊！

m0_59164520的博客

03-27

624

Transformer和UNet是两种常见的图像分割架构。然而，在图像分割时，Transformer由于low-level细节不足，存在定位能力不足的问题；而UNet则在显式建模长期依赖关系方面局限性大。。因此，如果你正在纠结医学图像方向怎么找创新点，那不妨来看看这个方向！今天我也在这里给大家分享三个，帮助大家轻松找到医学图像分割的创新点！

[Transformer]Transformer-Unet: Raw Image Processing with Unet

qq_37151108的博客

10-24

4858

Transformer-Unet: Raw Image Processing with UnetAbstractSection I IntroductionSection II Related WorkSection III MethodSection IV ImplementationSection VI  Conclusion Unet) Abstract 医学图像分割任务在医学图像分析领域十分重要，精确的分割结果可以帮助医生进行诊断，提升患者就诊体验。UNet是最被广泛采用的用于医学图像分割的框架，因

Transformer结合U-Net登上Nature子刊！最新成果让精度和效率都很美丽

学姐带你玩AI的博客

06-11

2306

最近一种基于视觉Transformer改进的U-Net来检测多光谱卫星图像中甲烷排放的深度学习方法登上了Nature子刊。与传统方法相比，该方法可以识别更小的甲烷羽流，显著提高检测能力。这类，它利用了U-Net能够保留高分辨率特征和精确定位的优势，并通过引入Transformer的自注意力和交叉注意力，提升模型对复杂任务中长程依赖关系和空间上下文信息的捕捉能力。这种设计让模型在解码阶段能够同时利用全局和局部信息，，也为我们的研究。为了帮助各位全面掌握的方法并寻找创新点，本文总结了。

用 Transformer 替换 diffusion 的U-Net：可伸缩的 diffusion 模型

深度学习与计算机视觉

11-08

1732

论文标题： Scalable diffusion models with transformers论文链接：https://openaccess.thecvf.com/content/ICCV2023/html/Peebles_Scalable_Diffusion_Models_with_Transformers_ICCV_2023_paper.html代码：https://github.com/...

当Transformer又遇见U-Net！Transformer-Unet：医学图像分割新工作

阿木寺的博客

09-28

5073

点击下方卡片，关注“CVer”公众号AI/CV重磅干货，第一时间送达转载自：集智书童Transformer-Unet: Raw Image Processing with Unet论文：h...

【爆火】TransUNet：融合Transformer与U-Net的医学图像分割神器！

weixin_62921094的博客

07-02

4004

在医学图像分割领域，传统的U-Net模型已经取得了显著成果。然而，随着Transformer在计算机视觉领域的崛起，将其与U-Net结合的TransUNet模型成为了新的热门。TransUNet是一种融合了Transformer和U-Net结构的深度学习模型，旨在提高医学图像分割的精度。它结合了Transformer的全局上下文理解能力和U-Net的局部特征提取能力，非常适合处理复杂的医学图像。然后需要生成一个包含训练数据集信息的txt文件，具体的生成代码如下，利用同样的方法生成验证集的txt文件。

ACC-UNet——基于Transformers与UNet的语义分割模型

知来者逆的博客

05-03

2628

在过去十年中，计算机视觉领域经历了一场根本性的变革，这主要归功于视觉转换器（Visual Transformers）的引入。这一变革同样影响了医学成像领域，其中UNet架构通过采用转换器技术进行了重要重构，成为了该领域内极具影响力的模型之一。近期的研究，如ConvNext，重新评估了卷积模型在视觉任务中的有效性，这一工作启发了我们对现有技术的进一步改进。我们的目标是提升传统的纯卷积UNet模型，使其在性能上能与基于Transformer的模型如Swin-Unet和UCTransNet相媲美。

Transformer-Unet:使用变压器编码器的Unet实现

03-05

变压器-Unet 使用变压器编码器的Unet实现

【论文阅读笔记】混合Transformer U-net用于医学图像分割

qq_37149304的博客

03-02

1097

用于医学图像分割的混合transformer U-Net

直接起飞！Transformer+U-Net，2025依旧炙手可热！

m0_73122726的博客

04-17

542

AFTer-UNet通过轴向融合机制，将卷积层和变换器的优势相结合，减少了计算复杂度，同时在多器官分割数据集上取得了优异的分割效果。构建模型：设计包含生成器和判别器的MWG-UNet++架构，其中RAUNet结合Transformer和U-Net进行脑肿瘤分割。提出MWG-UNet++模型，将Transformer集成到U-Net框架中，增强了模型捕捉长距离依赖和全局上下文的能力。通过分析Unet的特征学习模式，引入语义一致性正则化和内部特征蒸馏，在多个数据集上实验验证了该方法的有效性。

论文泛读：从U-Net到Transformer：深度模型在医学图像分割中的应用综述

T548164的博客

11-02

357

精准分割医学图像中的病灶对医生探寻病因和制定诊疗方案起关键作用，计算机视觉技术的发展促使深度学习在医学图像分割领域衍生出多种模型架构，U-Net架构以其巧妙的跳跃连接、易于优化的模块设计成为这一领域的基准模型。为帮助本领域学者了解U型网络的发展历程及研究现状，该文以问题为导向对近七年U型网络改进工作进行综述，首先，从改进结构位置的角度对U-Net及其各项改进模型进行叙述，探讨各工作的研究目的和创新设计及不足之处。其次，对Transformer与U型网络的结合方式进行分析，从中获取改进工作的研究动向。

Transformer+UNet到底是谁想出来的点子！用来创新真的太绝了！

热门推荐

qq_35989942的博客

03-31

1万+

一. 对比 U-Net Transformer 优点融合深层语义信息和高精度特征所含信息提取全局信息不足无法对距离较远的特征的上下文关系进行建模缺少局部细节处的信息二. 网络 1. TransUNet 文章：TransUNet: Transformers Make Strong Encoders for Medical Image Segmentation 2. TransFuse 文章：TransFuse: Fusing Transformers and CNNs

transformer和u-net的cca区别

03-31