
计算机视觉
ruoruoleon
这个作者很懒,什么都没留下…
展开
-
SENet论文理解
参考博客:https://blog.youkuaiyun.com/wfei101/article/details/79672944https://blog.youkuaiyun.com/u014380165/article/details/78006626pytorch代码:https://github.com/miraclewkf/SENet-PyTorch1. 为什么提出该网络?普通的卷积网络通常是在...原创 2019-04-06 14:51:03 · 1494 阅读 · 0 评论 -
FCOS:Fully Convolutional One-Stage Object Detection--------论文理解
参考博客:https://blog.youkuaiyun.com/qiu931110/article/details/890732441. 概述论文提出了一种新的目标检测方法,通过像素预测方式的目标检测,类似于语义分割。目前的目标检测都是基于锚框机制的,如two-stage的Faster R-CNN等,one-stage的RetinaNet,SSD,YOLOv3等。相比之下,本文中提出的FCOS...原创 2019-04-20 16:11:56 · 1416 阅读 · 0 评论 -
DSOD--------论文理解
参考博客:https://blog.youkuaiyun.com/u014380165/article/details/771107021. 概述该论文主要涉及了一种可以从头学习对象检测器的框架------Deeply Supervised Object Detector (DSOD)。现有的目标检测都需要现在ImageNet上进行预训练后,再通过分类损失和定位损失进行微调。微调模型的好处是可以...原创 2019-05-19 15:18:24 · 1083 阅读 · 0 评论 -
Beyond Skip Connections: Top-Down Modulation for Object Detection--------论文解读
参考博客:https://blog.youkuaiyun.com/zhangjunhit/article/details/702116871. 概述近年来,目标检测已经取得巨大的进步。通过针对更深入的前馈网络,已经实现了大多数网络的改进。然而,许多难区分的对象类别,例如瓶子,遥控器等,需要表示细节,而不仅仅是粗略的语义表示。且许多细节会丢失在前几层卷积层中。我们需要的是一种可以将底层一些更细致的特...原创 2019-05-25 11:03:15 · 601 阅读 · 0 评论 -
Pyramid Feature Attention Network for Saliency detection------论文理解
代码链接:https://github.com/CaitinZhao/cvpr2019_Pyramid-Feature-Attention-Network-for-Saliency-detection1. 概述在显著性检测算法中,如何提取到更有效的特征是该任务的难点之一。如今算法多通过融合多尺度特征来提取更有效的特征,但并不是所有的特征都是有效的,而且有些可能导致相反的效果。为了解决该...原创 2019-05-12 15:51:49 · 5407 阅读 · 3 评论 -
Deep Layer Aggregation----------论文理解
1. 概述视觉识别需要丰富的表示,从低到高,从小到大,从细到粗的分辨率。架构网络正在探索骨干网络以设计更深以及更宽的网络,但如何融合这些层以及这些块值得进一步的探讨。尽管已经提出了残差网络来组合层,但这些连接本身已经“浅”,并且仅通过简单的一步操作融合。我们认为通过更深层次的融合可以更好的聚合不同层的信息。我们的深层聚合结构以迭代和分层方式合并特征层次结构,使网络具有更高的准确性和更少的参数。...原创 2019-05-17 10:41:12 · 3963 阅读 · 2 评论 -
ESPNet:Efficient Spatial Pyramid of Dilated Convolutions for Semantic Segmentation-------论文理解
参考博客:https://blog.youkuaiyun.com/sinat_37532065/article/details/85723068论文链接:https://arxiv.org/abs/1803.06815v21. 概述提出在资源约束的情况下仍然能有效的对高分辨率图片进行语义分割的网络,ESPNet,基于一个新的卷积模块,即高效的空间金字塔(ESP),它在计算,内存和功率方面都很有效。...原创 2019-05-28 10:31:23 · 582 阅读 · 0 评论 -
Large Kernel Matters—— Improve Semantic Segmentation by Global Convolutional Network------论文理解
参考博客:https://blog.youkuaiyun.com/zhangjunhit/article/details/745305961. 概述目前网络架构设计的趋势均是在相同计算量的前提下将大的卷积核替换为多个小的卷积核(如1x1和3x3)堆叠而成 。但在语义分割中需要同时进行分类和定位的时候大的卷积核占很重要的角色。为解决分类和定位问题,我们提出了GCN网络。同时提出了基于残差的边界修正,来更...原创 2019-06-05 10:15:05 · 447 阅读 · 0 评论 -
MobileNetV2--------论文理解
参考博客:https://blog.youkuaiyun.com/u014380165/article/details/79200958https://www.cnblogs.com/darkknightzh/p/9410574.html代码链接:https://github.com/tonylins/pytorch-mobilenet-v21. 深度可分离卷积深度可分离卷积分为DWC(dep...原创 2019-05-24 11:01:05 · 579 阅读 · 0 评论 -
CornerNet: Detecting Objects as Paired Keypoints--------论文理解
参考博客:https://blog.youkuaiyun.com/u014380165/article/details/830322731. 提出该网络的动机目前的目标检测大多数都是基于anchor boxes(锚框)的,如faster r-cnn,yolov2,yolov3等,但这一类检测有两个缺点:一,我们需要一大堆锚框。因为检测器需要判断锚框和真实框是否很大程度的重叠,因此需要大量的锚框。这...原创 2019-04-19 15:55:00 · 576 阅读 · 0 评论 -
Parallel Feature Pyramid Network for Object Detection-------论文理解
参考博客:https://blog.youkuaiyun.com/u014380165/article/details/824687251. 概述目前目标检测的研究,基本上是逐渐增加金字塔形状的特征层数量而不是使用特征化的图像金字塔。然而,CNN特征层的不同抽象级别通常会限制检测性能,尤其是在小型对象上。因此本文提出了一种基于CNN的物体检测架构,称为并行特征金字塔(FP)网络(PFPNet),其中F...原创 2019-04-28 10:49:38 · 1165 阅读 · 0 评论 -
SKNet-------论文理解
参考博客:https://blog.youkuaiyun.com/qixutuo6087/article/details/88822428pytorch代码:https://github.com/pppLang/SKNet1. 为什么提出该网络?当我们在距离目标不同远近程度看一个物体时,我们的视觉皮层神经元会选择不同的接受域来感受该物体。因此,本文提出一种动态选择机制使每一个神经元可以针对目标物...原创 2019-04-07 15:40:46 · 3391 阅读 · 5 评论 -
Res2Net------论文理解
1. 设计网络的动机目前现有的特征提取方法大多都是用分层方式表示多尺度特征。分层方式即要么对每一层使用多个尺度的卷积核进行提特征(如SPPNet),要么就是对每一层提取特征进行融合(如FPN)。本文提出的Res2Net在原有的残差单元结构中又增加了小的残差块,增加了每一层的感受野大小。Res2Net也可以嵌入到不同的特征提取网络中,如ResNet, ResNeXt, DLA等等。2. ...原创 2019-04-07 21:14:41 · 16517 阅读 · 5 评论 -
Scale-Transferrable Object Detection-----论文理解
参考博客:https://blog.youkuaiyun.com/qq_20481015/article/details/815352141. 提出该网络的动机尺度问题是目标检测的核心。目前大多数网络都是通过多尺度检测来解决图像中存在多尺度物体的情况,基本上都是融合不同卷积层的特征图,这些方法都需要添加额外的层数来解决小目标检测问题,这样无疑增加了计算量以及模型的复杂性。因此,本文提出一种尺度变换模块...原创 2019-04-08 20:43:15 · 290 阅读 · 0 评论 -
M2Det:A Single-Shot Object Detector based on Multi-Level Feature Pyramid Network 论文理解
参考博客:https://blog.youkuaiyun.com/sinat_37532065/article/details/873853021. 提出该网络的原因金字塔网络的提出是为了解决在目标检测任务中一个图片中存在多尺度目标的问题。已经广泛应用在两步(如rcnn系列等)和一步(如yolo,ssd等)的目标检测网络中。目前一些多尺度特征提取网络的缺点:由于它们仅根据最初为物体分类任务设计的骨...原创 2019-04-12 14:26:06 · 2230 阅读 · 0 评论 -
PSPNet论文理解
参考博客:https://blog.youkuaiyun.com/u011974639/article/details/789851301. 概述场景解析的目的旨在为每一个像素分配一个类别标签。可以同时预测到标签,位置,以及每一个元素的形状。目前场景解析框架多数依赖于FCN, 取得较好的效果。但由于FCN存在缺少充分利用全局场景类别线索的缺点,使场景解析仍然面临有限制:多样化的场景和不受限制的词汇...原创 2019-04-16 10:49:42 · 1197 阅读 · 0 评论 -
ResNeXt-------论文理解
参考博客: https://blog.youkuaiyun.com/u014380165/article/details/71667916/转载 2019-04-09 20:45:53 · 204 阅读 · 0 评论 -
DSSD:Deconvolutional Single Shot Detector-------论文理解
参考博客:https://blog.youkuaiyun.com/jesse_mx/article/details/55212179?utm_source=itdadao&utm_medium=referral1. 概述改论文中,作者总的有两个贡献:一,将原始的SSD中用到的骨干网络vgg-16换为resnet-101,目的是为了使特征提取能力更强;二,检测网络中,在原有SSD后添加的...原创 2019-04-13 10:48:10 · 368 阅读 · 0 评论 -
A Simple Pooling-Based Design for Real-Time Salient Object Detection------论文理解
论文链接: https://arxiv.org/abs/1904.095691. 摘要本文将通过扩展卷积神经网络中的池化部分来解决显著目标检测问题。在特征金字塔的基础上,在bottom-up途径上加入GGM模块(global guidance module),旨在为不同特征层提供潜在显著对象的位置信息。在top-down途径加入FAM模块(feature aggregation mod...原创 2019-04-26 10:23:06 · 4962 阅读 · 2 评论 -
CBAM: Convolutional Block Attention Module------论文理解
参考博客:https://blog.youkuaiyun.com/u013738531/article/details/82731257pytorch代码:https://github.com/luuuyi/CBAM.PyTorch1. 概述本论文提出了一种简单但有效的注意力网络---Convolutional Block Attention Module(CBAM)。给定一个中间的特征图,我们的...原创 2019-05-31 11:10:30 · 3092 阅读 · 8 评论