
图像分类
文章平均质量分 91
图像分类专栏
陈生~
这个作者很懒,什么都没留下…
展开
-
【经典分类框架】vgg/GoogLeNet/ResNet/DenseNet/MobileNet/ShuffleNet
太早的LeNet和AlexNet就不提了,也相对比较简单。vgg16 vgg19文章《VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE SCALE IMAGE RECOGNITION》发现了小卷积核搭配更深的网络会有更好的效果。小卷积核堆叠在保持感受野不变的情况下参数更少,网络更深学习能力更强。结构:前面一堆卷积层后面跟三层全连接层。卷积核全为...原创 2020-03-28 15:09:17 · 1947 阅读 · 0 评论 -
MLP在CV上的复兴,“Pay Attention to MLPs“
前言本文写于2021年8月27日。最近好像没人写这方面的总结,我就稍微写一写。transformer最近成为cv学术圈的宠儿,有声音鼓吹要取代CNN。然而透过一切浮华的外表,有人说,不就是MLP+softmax嘛。这不,谷歌吹响了复兴MLP的号角,一系列魔改接踵而至。MLP能否达到transformer的热度?拭目以待。为什么需要要复兴MLP?我觉得有两个原因很重要:简单,通用。目前的实验结果表明,MLP确实有复兴的希望。先锋:MLP-MixerMLP-Mixer: An all-MLP Arc原创 2021-08-27 17:45:58 · 1174 阅读 · 2 评论 -
CNN中特征融合的一些策略
尽管特征融合的方法很多,但如果数学化地表示,大体可以分为以下几种形式:X+Y\textbf{X}+\textbf{Y}X+Y: X\textbf{X}X、Y\textbf{Y}Y表示两个特征图,+++表示元素级相加. 代表如ResNet、FPNX concat Y\textbf{X} \; concat\;\textbf{Y}XconcatY .concatconcatconcat表示张量 拼接操作。 代表如GoogleNetX+G(Y)⋅Y\textbf{X}+\textbf{G(Y)}\cd原创 2020-11-29 20:51:39 · 13955 阅读 · 3 评论 -
【图像分类实战】比赛技巧总结
如何扩充数据集1、使用外部公开的数据集,比如从ImageNet中抽出相应的类2、数据增广3、如果必要的话,将验证集加入训练如何提高模型的表现1、如果设备允许的话,尝试更深、更宽的模型2、尝试把当前流行的结构诸如res模块、inception模块、attention机制等加入合适的位置3、如果必要的话,做模型的集成。e.g.分类任务,用resnet50得出一组概率,用vgg19得出另一组概率,将它们相加取概率最大的标签作为最终的结果。如何解决尺寸不平衡问题解决图像尺寸不统一一般有两种方法:1原创 2020-05-09 23:10:41 · 1094 阅读 · 0 评论