
深度学习【论文】
阅读论文
dlut_yan
坚持坚持在坚持,
展开
-
一些目标检测相关的论文简介
AlexNetVGGGooLeNetFPNResNetYOLO系列SSDrcnn系列:fast rcnn、faster rcnnMask rcnn9. Mask rcnnMask R-CNN是ICCV 2017的best paper。Mask R-CNN是继承于**Faster R-CNN (2016)**的,Mask R-CNN只是在Faster R-CNN上面加了一个M...原创 2019-12-19 16:48:32 · 879 阅读 · 1 评论 -
【论文笔记】CSPNet(未完)
参考:论文翻译:感觉这个人是有道翻译的,很多地方翻译的并不好,但是还是可以稍微参考一下。CSPNet论文简单的总结转载 2020-03-08 11:32:23 · 1867 阅读 · 0 评论 -
【论文理解】focal loss交叉熵
一、为什么改进交叉熵?Single stage detector不好的原因完全在于:极度不平衡的正负样本比例: anchor近似于sliding window的方式会使正负样本接近1000:1,而且绝大部分负样本都是easy example,这就导致下面一个问题:gradient被easy example dominant的问题:往往这些easy example虽然loss很低,但由于数量...转载 2019-12-19 19:59:58 · 2023 阅读 · 0 评论 -
【论文理解】yolov3损失函数
看了很多关于yolov3的算法讲解,但是对于损失函数一直没怎么看懂,再看代码,发现完全不懂,所以决定再仔细看看yolov3的损失函数。先回顾下YOLOv1的损失函数:Loss=λcoord∑i=0S2∑j=0BIijobj[(xi−x^i)2+(yi−y^i)2]+λcoord∑i=0S2∑j=0BIijobj[(wi−w^i)2+(hi−h^i)2]+∑i=0S2∑j=0BIijobj(...原创 2019-09-18 18:38:28 · 53664 阅读 · 78 评论 -
【论文理解】理解yolov3的anchor、置信度和类别概率
以前写过一篇博客,都是转载其余博主的内容,对yolov3有了基本认识,但是当时只浮于表面,并没有真正的理解yolov3,现在对于yolov3的anchor计算,损失函数的计算有了一些新的理解,记录一下。在网络最后的输出中,对于每个grid cell产生3个bounding box,每个bounding box的输出有三类参数:一个是对象的box参数,一共是四个值,即box的中心点坐标(x,y...转载 2019-09-18 14:34:02 · 41512 阅读 · 71 评论 -
【论文笔记】faster rcnn
转载,仅供自己学习,侵删。一、 算法详解:Faster-rcnn主要包括4个关键模块,特征提取网络、生成ROI、ROI分类、ROI回归。特征提取网络:它用来从大量的图片中提取出一些不同目标的重要特征,通常由conv+relu+pool层构成,常用一些预训练好的网络(VGG、Inception、Resnet等),获得的结果叫做特征图feature map;生成ROI(RPN):在获得的特...转载 2019-06-14 10:23:30 · 1092 阅读 · 0 评论 -
【论文笔记】fast RCNN
全部转载已附上链接,只是为了自己记录学习,如有侵权,请联系删除。R-CNN网络的主要问题有:1.使用selective search产生proposal,操作耗时,且不利于网络的整体训练和测试;2.产生的proposal需要经过warp操作再送入后续网络,导致图像的变形和扭曲;3.每一个proposal均需要单独进行特征提取,重复计算量大;4.R-CNN的训练都包含多个单独步骤:先预训练...转载 2019-06-11 16:35:33 · 642 阅读 · 0 评论 -
【论文理解】RCNN 的 Bounding-Box regression (回归器)
全文转载别人的,总结各位大神的内容,如有侵权,请联系作者删除。为什么要边框回归?对于上图,绿色的框表示Ground Truth, 红色的框为Selective Search提取的Region Proposal。那么即便红色的框被分类器识别为飞机,但是由于红色的框定位不准(IoU<0.5), 那么这张图相当于没有正确的检测出飞机。 如果我们能对红色的框进行微调, 使得经过微调后的窗口跟...转载 2019-06-05 14:01:33 · 3888 阅读 · 3 评论 -
【论文笔记】RCNN
1、创新点:本文解决了目标检测中的两个关键问题。问题一:速度经典的目标检测算法使用滑动窗法依次判断所有可能的区域。本文则预先提取一系列较可能是物体的候选区域,之后仅在这些候选区域上提取特征,进行判断。问题二:训练集经典的目标检测算法在区域中提取人工设定的特征(Haar,HOG)。本文则需要训练深度网络进行特征提取。可供使用的有两个数据库:一个较大的识别库(ImageNet ILSVC ...转载 2019-06-01 11:43:03 · 1002 阅读 · 0 评论 -
【论文笔记】ssd
转载,仅供自己学习,侵删。一、背景基于“Proposal + Classification”的目标检测方法中,R-CNN 系列(R-CNN、 SPPnet、Fast R-CNN以及 Faster R-CNN等)取得了非常好的结果,但是在速度方面离实时效果还比较远。在提高 mAP (Mean Average Precision) 的同时兼顾速度,逐渐成为神经网络目标检测领域未来的趋势。YOLO...转载 2019-06-24 18:33:18 · 2608 阅读 · 2 评论 -
【论文笔记】YOLOv3
转载,侵删。新的网络结构Darknet-53先从特征提取网络说起。YOLOv2时用的是Darknet-19网络来提取特征,这次修改成了Darknet-53,网络又加深了不少,看一下Darknet-53的结构与性能:虽然运算复杂度提升了一点,但是它的浮点运算能力以及top-1,top-5表现有很大提高.速度降了一点,但是还是很高。看一下YOLOv3网络整体:Demolayer ...转载 2019-07-15 14:15:10 · 1773 阅读 · 0 评论 -
【论文笔记】YOLO v2
全文转载,侵删。YOLO有两个缺点:(1)定位不准确(2)和基于region proposal的方法相比召回率较低。因此YOLOv2主要是要在这两方面做提升。另外YOLOv2并不是通过加深或加宽网络达到效果提升,反而是简化了网络。下面就是使用的一些手段。1 添加了BN(Batch Normalization)层,map提高了2%Batch Normalization可以提升模型收敛速...转载 2019-07-11 21:10:50 · 1545 阅读 · 0 评论 -
【论文笔记】YOLO
全文转载,仅供自己学习,侵删。RCNN:我们先来研究一下图片,嗯,这些位置很可能存在一些对象,你们对这些位置再检测一下看到底是哪些对象在里面。YOLO:我们把图片大致分成98个区域,每个区域看下有没有对象存在,以及具体位置在哪里。RCNN:你这么简单粗暴真的没问题吗?YOLO:当然没有…咳,其实是有一点点问题的,准确率要低一点,但是我非常快!快!快!RCNN:为什么你用那么粗略的候选区...转载 2019-06-13 20:33:41 · 3446 阅读 · 0 评论 -
【论文笔记】ResNet
一. 背景background网络Alexnet的出现带火了深度学习,最重要的特点为通过数据驱动让模型自动学习特征,省去了人工寻找特征的步骤。在深度网络中,各个特征会不断的经过线性非线性的综合计算,越深的网络输出表示能力越强的特征。所以,网络的深度对于学习表达能力更强的特征至关重要,这一问题在VGGNet中得到很好体现。深度模型中,每层的输出特征图的尺寸大都随着网络深度而变化,主要是高和...转载 2019-10-24 14:36:12 · 463 阅读 · 0 评论 -
【论文笔记】VGG
总体的体系结构训练阶段,输入为固定的224x224的RGB图像。唯一做的预处理是对每个像素减去训练集中的RGB均值。卷积核使用3x3,在我们的一种配置中也有使用1x1的情况,这可以看作是对输入通道的一个线性变换(其后面接一个非线性变换)。步长固定为一像素。padding用来保持卷积后图像的原来大小分辨率。空间池化包含五个最大池化层,它们接在部分卷积层的后面,(并不是所有卷积层都接有最大池化层)。...转载 2019-05-29 20:25:00 · 3888 阅读 · 5 评论 -
目标检测评价指标Precision Recall AP mAP
什么是IoU在目标检测算法中,我们经常需要评价2个矩形框之间的相似性,直观来看可以通过比较2个框的距离、重叠面积等计算得到相似性,而IoU指标恰好可以实现这样的度量。简而言之,IoU(intersection over union,交并比)是目标检测算法中用来评价2个矩形框之间相似度的指标IoU = 两个矩形框相交的面积 / 两个矩形框相并的面积,如下图所示:什么是TP TN FP FN...转载 2019-09-24 15:19:33 · 2511 阅读 · 0 评论 -
目标检测之分类、回归和损失函数
一 、分类和回归输出变量为有限个离散变量的预测问题成为分类问题;输入变量与输出变量均为连续变量的预测问题是回归问题;分类模型和回归模型本质一样,分类模型是将回归模型的输出离散化。二 、分类和回归应用场景1.回归问题的应用场景回归问题通常是用来预测一个值,如预测房价、未来的天气情况等等,例如一个产品的实际价格为500元,通过回归分析预测值为499元,我们认为这是一个比较好的回归分析。一个...转载 2019-07-17 14:58:11 · 6372 阅读 · 0 评论 -
利用神经网络进行目标检测 的 学习过程
刚刚接触利用神经网络进行目标检测。基础:https://www.zybuluo.com/hanbingtao/note/433855【目标检测主要CNN,所以只需要看1、2、3、4】https://blog.youkuaiyun.com/liufanghuangdi/article/details/81188283【这篇博客不是很全面但是写的通俗易懂】有关梯度下降法:https://blog.csd...转载 2019-05-27 11:33:28 · 1887 阅读 · 0 评论