MaxViT: 多轴视觉变换器

MaxViT: 多轴视觉变换器

maxvit [ECCV 2022] Official repository for "MaxViT: Multi-Axis Vision Transformer". SOTA foundation models for classification, detection, segmentation, image quality, and generative modeling... maxvit 项目地址: https://gitcode.com/gh_mirrors/ma/maxvit

1. 项目基础介绍

MaxViT 是一个开源项目,由 Google Research 和 University of Texas at Austin 的研究人员共同开发。该项目是官方的 TensorFlow 实现,旨在提供一种混合 CNN 和 ViT 的图像分类模型。主要使用的编程语言为 Python 和 Jupyter Notebook。

2. 项目核心功能

MaxViT 模型是一系列混合(CNN + ViT)图像分类模型,其在参数和 FLOPs 效率上都优于最先进的 ConvNets 和 Transformers。以下是项目的核心功能:

  • 多轴视觉变换器架构MaxViT 通过其独特的架构,能够在整个网络中实现全局视野,尤其是在早期、高分辨率阶段。
  • 性能优势:在 ImageNet-1K 和 ImageNet-21K 数据集上,MaxViT 模型展现了卓越的性能。
  • 扩展性MaxViT 模型能够很好地扩展到大型数据集,如 ImageNet-21K。

3. 项目最近更新的功能

最近更新的功能包括:

  • 模型权重更新:增加了 MaxViTTiny 和 MaxViTSmall 的模型权重。
  • Colab 教程:提供了一个 Google Colab 教程,展示如何运行 MaxViT 模型进行图像处理。
  • TensorFlow Model Garden 支持MaxViT 官方发布在 TensorFlow Model Garden,以支持训练。
  • 论文和代码发布:相关的论文和代码已经发布,供社区进一步研究和使用。

通过这些更新,MaxViT 项目不仅增强了其模型的可用性和功能性,而且也为社区提供了更多的学习资源和工具。

maxvit [ECCV 2022] Official repository for "MaxViT: Multi-Axis Vision Transformer". SOTA foundation models for classification, detection, segmentation, image quality, and generative modeling... maxvit 项目地址: https://gitcode.com/gh_mirrors/ma/maxvit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

房栩曙Evelyn

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值