一、SwinTransformer论文
论文地址:arxiv.org/pdf/2103.14030.pdf
二、 SwinTransformer网络结构
SwinTransformer是一种基于transformer的图像分类网络结构。SwinTransformer是由微软亚洲研究院提出的,其特点是具有高效的计算和参数效率。
SwinTransformer的网络结构主要包括以下几个部分:
图片块划分:将输入的图片划分成多个非重叠的小块。
窗口分区:将小块按照一定的窗口大小进行分区。每个分区由一个可学习的线性变换独立处理。
深层网络:每个分区的特征经过深层网络处理,得到更高级别的特征表示。
跨窗口连接:不同