10 ConvNeXt

最新推荐文章于 2025-04-23 17:02:28 发布

Xlxlkkxx

最新推荐文章于 2025-04-23 17:02:28 发布

阅读量357

点赞数

分类专栏：分类文章标签：深度学习人工智能神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_63510030/article/details/130598371

版权

分类专栏收录该内容

16 篇文章

订阅专栏

文章探讨了Transformer模型在某些情况下优于卷积神经网络(ConvNet)的原因，并提出通过改进ResNet结构，创建名为ConvNeXt的模型，旨在达到比两者更好的性能。实验中，作者详细介绍了ConvNeXt的Block设计和不同版本的网络配置，如T/S/B/L版本，其计算复杂度与SwinTransformer的对应版本相当。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

目录

一、理论知识

1. Block及网络模型

2. 参数配置

二、代码复现

仅是个人笔记，代码学习资源来源B站博主霹雳吧啦Wz的个人空间_哔哩哔哩_bilibili

一、理论知识

论文作者认为可能各种新的架构以及优化策略促使Transformer模型比Conv的效果更好

使用相同的策略去训练卷积神经网络也能达到相同的效果吗？

相当于参考Swin-Transformer，改进resnet结构，最终达到比两者都好的效果。

做的实验，一步步改进如下：

1. Block及网络模型

ConvNeXt-T 结构图

2. 参数配置

ConvNeXt网络有T/S/B/L四个版本，计算复杂度刚好和Swin Transformer中的T/S/B/L相似。

ConvNeXt-T: C = (96, 192, 384, 768), B = (3, 3, 9, 3)
ConvNeXt-S: C = (96, 192, 384, 768), B = (3, 3, 27, 3)
ConvNeXt-B: C = (128, 256, 512, 1024), B = (3, 3, 27, 3)
ConvNeXt-L: C = (192, 384, 768, 1536), B = (3, 3, 27, 3)
ConvNeXt-XL: C = (256, 512, 1024, 2048), B = (3, 3, 27, 3)
其中C代表4个stage中输入的通道数，B代表每个stage重复堆叠block的次数

二、代码复现

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。