
计算机视觉
Chen_Swan
这个作者很懒,什么都没留下…
展开
-
【论文笔记】【cnn】ResNest详解
摘要:ResNest主要贡献是设计了一个Split-Attention模块,可以实现跨通道注意力。通过以ResNet样式堆叠Split-Attention块,获得了一个ResNet的变体。ResNest网络保留了完整的ResNet结构,可以直接用下游任务,而不会引起额外的计算成本。ResNest在分类、FasterRCNN、DeeplabV3上都有提升。动机:著名的ResNet是针对图像分...原创 2020-04-24 17:41:58 · 6245 阅读 · 7 评论 -
【论文笔记】【cnn】Densenet详解
Densenet受启发于resnet,通过shortcut(skip connection)建立前面层到后面层的联系,有助于训练过程中的梯度反向传播。相比于resnet,densenet设计了更密集的shortcut,建立了前面的所有层和后面的密集连接。Densenet还通过特征在channel上的连接来实现特征重用,这减少了DenseNet的参数量和计算成本。DenseNet提出了一个非...原创 2020-04-22 17:51:11 · 1751 阅读 · 0 评论 -
【论文笔记】【cnn】ResNeXt详解
ResNeXt解决的问题:传统的要提高模型的准确率,都是加深或加宽网络,但是随着超参数数量的增加(channels,filter size等),网络设计的难度和计算开销也会增加。本文提出的ResNeXt结构可以在不增加参数复杂度的情况下提高准确率,同时还减少了超参数的数量。ResNeXt乍一看很像inception,作者也在论文中提到了vgg相关。VGG和resnet主要采用堆叠网络来实现...原创 2020-04-22 14:39:37 · 891 阅读 · 0 评论 -
【论文笔记】【目标检测】fpn详解
fpn是在卷积神经网络中图像金字塔的应用。图像金字塔在多尺度识别中有重要的作用,尤其是小目标检测。论文中给了这么一张图来展示4种利用特征的形式。(a)图像金字塔。这个是直接把图片resize成不同的尺度,使用不同的尺度对应生成不同的特征。缺点是时间成本很大,如果在测试的时候使用四级的图像金字塔,那么测试时间*4.(b)只用最后一层特征。在fpn之前的算法,faster rcnn和s...原创 2020-04-22 10:51:48 · 1598 阅读 · 0 评论 -
【论文阅读】【cnn】resnet
resnet解决的是网络的退化问题。在vgg中提出,增加网络深度可以增加模型的表达能力。但是人们发现深度达到一定之后,CNN网络再一味增加层数并不能带来分类性能的提高,甚至会让网络收敛变慢,测试集精度下降。训练集精度下降可以说明这个不是过拟合的原因。因此resnet提出这是网络的“退化问题”。深度神经网络可以拟合各种表示,按道理说,n+1层的cnn的解空间包含了n层的cnn的解空间,因此n+1...原创 2020-04-22 10:52:57 · 552 阅读 · 0 评论 -
【论文笔记】【目标检测】faster rcnn详解
我终于看懂了这篇paper!RCNN解决了用卷积网络做目标检测的问题,通过selective search在特征图上得到region proposal,进而使用svm进行二分类,得到了目标检测需要的分类信息和位置信息。Fast rcnn解决了RCNN得到region proposal费时费空间的问题。通过引入Roi pooling使任意大小的输入可以输出为指定大小的roi向量,这样,一张图...原创 2020-04-20 21:20:15 · 620 阅读 · 0 评论 -
【论文笔记】【目标检测】Fast RCNN详解
Fast RCNN是对RCNN论文的改进。RCNN简介:(1)image input;(2)利用selective search 算法在图像中从上到下提取2000个左右的Region Proposal;(3)将每个Region Proposal缩放(warp)成227*227的大小并输入到CNN,将CNN的fc7层的输出作为特征;(4)将每个Region Proposal提取的...原创 2020-04-20 15:42:28 · 1647 阅读 · 0 评论