
transformer
文章平均质量分 90
GXU_PJM
这个作者很懒,什么都没留下…
展开
-
TransUNet: Transformers Make Strong Encoders for Medical Image Segmentation(阅读笔记)
AbstractTransUNet:Transformers为医学图像分割做强大编码器。医学图像分割领域U-Net架构取得突出成果但在远程依赖关系上有局限,而序列预测transformer由于low-level细节不足导致定位能力受限,本文提出transformer与U-Net结合,transformer将CNN特征图编码为上下文序列,解码器对编码的特征上采样,再与高分辨率特征图结合实现精准定位,结合transformer的U-Net,是医学图像分割的有效方案。IntroductionCNN..原创 2021-03-06 18:57:45 · 1328 阅读 · 0 评论 -
Tokens-to-Token ViT: Training Vision Transformers from Scratch on ImageNet(阅读笔记)
Abstract在ImageNet上从头训练一个vision transformer(ViT)模型,ViT模型可以不依赖CNN,直接应用于图像块序列进行图像分类,但是在中等大小数据集(例如imageNet)上的效果不如CNN,主要原因:1.输入图像简单token化无法建模重要的局部特征。2.ViT的冗余注意力主干网设计在固定负载和有限样本约束下限制了特征丰富性。本文提出渐进式token化(Tokens to token)使每个Token更好地建模局部信息,借助CNN架构思想使用deep-narrow结构原创 2021-03-06 13:00:57 · 1374 阅读 · 1 评论