第二天：图像分类算法基础

weixin_46362881

于 2023-02-02 21:23:27 发布

阅读量194

点赞数

分类专栏： OpenMMlab实战训练营文章标签：人工智能计算机视觉算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_46362881/article/details/128857660

版权

OpenMMlab实战训练营专栏收录该内容

4 篇文章

订阅专栏

文章介绍了图像分类任务的目标和建模过程，从传统的手工特征设计到深度学习方法，如CNN、Transformer，以及轻量化模型设计。还讨论了模型学习的范式，包括监督、自监督学习，并提到了训练技巧如数据增强和学习率策略。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

第二天：图像分类算法基础

一、图像分类和基础的视觉模型

任务目标：给出一张图像，识别物体的类别

任务建模：图像像素→类别序号

技术路线：采集数据 → 定义模型 → 定义损失并训练 → 预测

传统方法：

手工设计图像特征：图像 →（人工设计）向量 →（机器学习）分类
特征学习：数据驱动拟合转化函数

深度学习方法：

卷积神经网络CNN
多头注意力机制Transformer

二、模型设计和模型学习

1. 卷积神经网络

经典工作：AlexNet、VGG，GoogleNet，ResNet
后续工作：SEResNet，ResNext
神经结构搜索：NAS→借助强化学习的方法搜索到最佳的网络架构
Transformer：ViT and SwinTransformer，ConvNext

2. 轻量化卷积网络模型设计

使用不同大小的卷积核：Inception模块：不同通道的卷积核大小可以不同→减少参数量
Bottleneck：ResNet中空间和通道分开计算两次
可分离卷积：逐层卷积和逐点卷积 → MobileNet
分组卷积：组数在（1，Ｇ）之间，分组之间的通道在空间分辨率上卷积，之后再进行空间交互

3. ViT

注意力机制 → 其实是数学上的加权求和，用一个参数对前一层的输出加权求和

与卷积不同，注意力机制中的参数和输入有关，并不像卷积一样核参数是常数，并且可以在全尺度上进行相关计算

4. Swin

窗口局部计算窗口内的注意力，并用滑窗交互
采用金字塔层级结构

三、模型学习的范式

1. 监督学习

最常见的范式，缺点是标注是昂贵的

2. 自监督学习

无须标注，设计辅助任务，让网络在无标注数据集中取得较好效果后在迁移到具体任务中

基于代理任务
基于对比学习：simCLR
基于mask学习：MAE

3. 训练技巧

随机初始化→Kaiming init初始化模型中的参数

用训练好的模型进行初始化
学习率：

从头学习可以调较大学习率：0.01→0.1

微调：0.001→0.01

学习率退火：按步长下降，按比例下降等

学习率升温：在训练前期不稳定阶段，前几轮逐步上升
经验型结论：Batchsize扩大N倍，学习率也变为N倍
早停、模型权重平均EMA
数据增强：几何变化，色彩变化，随机遮挡→作数据扩充，模拟更多情况
组合增强→cutmix（狗头贴在猫身上），mixup（狗头猫身）
标签平滑：引入噪声，使模型不在太自信于已有标签

weixin_46362881

博客等级

码龄5年

6
原创

0
点赞

0
收藏

1
粉丝

关注

私信

热门文章

分类专栏

代码随想录 2篇
OpenMMlab实战训练营 4篇

展开全部收起

上一篇：: 第一天：计算机基础和Openmmlab算法框架

下一篇：: 第三天：MMClassification

最新评论

Day2 数组part2
优快云-Ada助手: 恭喜您写了第6篇博客，标题为“Day2 数组part2”。这篇博客内容丰富，很有收获。我期待着您的下一篇博客，希望您能继续分享您的学习心得和经验，同时也建议您可以尝试一些其他的编程语言或者深入研究一些算法和数据结构的知识，这样可以更好地提升自己的编程技能。感谢您的分享，期待您的下一篇博客！优快云会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.youkuaiyun.com/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply6 看奖励名单。
Day1 数组part1
优快云-Ada助手: 恭喜您写出了第5篇博客，题目为“Day1 数组part1”，非常感谢您的不断创作。接下来，建议您可以进一步探讨数组的应用及其相关算法，丰富您的博客内容，让读者更加深入地了解数组的使用。期待您更多的精彩文章，继续加油！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.youkuaiyun.com/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
第一天：计算机基础和Openmmlab算法框架
优快云-Ada助手: Python入门技能树或许可以帮到你：https://edu.youkuaiyun.com/skill/python?utm_source=AI_act_python

大家在看

SQL 查询中常见关键字的正确顺序以及使用规则 664

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。