- 博客(3)
- 收藏
- 关注
原创 FCN、PSPNET、Deeplab-v3的网络结构
PPM模块通过对特征图进行不同尺度的池化操作,得到一系列不同尺度的特征图,然后将这些特征图进行上采样并拼接在一起,形成一个包含多尺度信息的特征图。FCN 模型处理过程,通过卷积和反卷积我们基本能定位到目标区域,我们会发现模型前期是通过卷积、池化、非线性激活函数等作用输出了特征权重图像,但是,我们经过反卷积等操作输出的图像实际是很粗糙的,毕竟丢了很多细节。正向过程的卷积、池化等操作都会输出每个层的特征,我们使用反卷积然后和历史中的池化和卷积数据结合,利用它们的数据填补我们缺失的数据。
2023-12-16 13:28:43
495
1
原创 Transformer、VIT、SWin-TR、DETR的网络结构和改进思路
具体来讲,ViT算法中,会将整幅图像拆分成小图像块,然后把这些小图像块的线性嵌入序列作为Transformer的输入送入网络,然后使用监督学习的方式进行图像分类的训练。由于Transformer本质上是一个序列转换的作用,因此,可以将DETR视为一个从图像序列到一个集合序列的转换过程。相比于ViT网络架构,Swin Transformer考虑了多尺度下的图像,可以看到如下图所示:其通过不断的下采样,在多个图像的尺度维度进行检测,这样的话直观上可以很好的解决我们先前说的视觉实体的规模尺度的大小不同的问题。
2023-12-16 12:41:08
756
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人