目录
政安晨的个人主页:政安晨
欢迎 👍点赞✍评论⭐收藏
收录专栏: TensorFlow与Keras机器学习实战
希望政安晨的博客能够对您有所裨益,如有不足之处,欢迎在评论区提出指正!
本文目标:用于高效图像分类的紧凑型卷积变换器
正如视觉变换器(ViT)论文中所讨论的,基于变换器的视觉架构通常需要比通常更大的数据集,以及更长的预训练时间。对于 ViT 而言,ImageNet-1k(拥有约一百万张图像)被认为属于中等数据规模。这主要是因为,与 CNN 不同,ViT(或典型的基于 Transformer 的架构)不具备信息充分