
深度学习
文章平均质量分 82
在路上DI蜗牛
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
目标检测--Faster RCNN算法架构及关键点解析
Fast-RCNN基本实现端对端(除了proposal阶段外),下一步自然就是要把proposal阶段也用CNN实现(放到GPU上)。这就出现了Faster-RCNN,一个完全end-to-end的CNN对象检测模型。本文是继RCNN,fast RCNN之后,目标检测界的领军人物Ross Girshick团队在2015年的又一力作。简单网络目标检测速度达到17fps,在PASCAL VOC上准确率...原创 2018-06-21 12:23:07 · 2211 阅读 · 0 评论 -
深度学习:Pooling池化操作的反向梯度传播
参考博客:https://blog.youkuaiyun.com/qq_21190081/article/details/72871704在看卷积神经网络的时候,突然想起来池化是会改变特征图的尺寸的,那反向传播是怎么实现的呢。于是搜了一些博客,感觉上面这个博客写得最清晰直观,就从这个博客里面搬了点东西过来作为笔记。Pooling池化操作的反向梯度传播CNN网络中另外一个不可导的环节就是Poolin...转载 2018-08-20 14:38:46 · 6657 阅读 · 0 评论 -
为什么小样本不建议用深度学习?
机器学习里,模型越复杂、越具有强表达能力越容易牺牲对未来数据的解释能力,而专注于解释训练数据。这种现象会导致训练数据效果非常好,但遇到测试数据效果会大打折扣。这一现象叫过拟合(overfitting)。深层神经网络因为其结构,所以具有相较传统模型有很强的表达能力,从而也就需要更多的数据来避免过拟合的发生,以保证训练的模型在新的数据上也能有可以接受的表现。对于classification m...转载 2018-08-04 11:29:17 · 8046 阅读 · 0 评论 -
目标检测--FPN解析
转载:Feature Pyramid Networks for Object Detection 总结最近在阅读FPN for object detection,看了网上的很多资料,有些认识是有问题的,当然有些很有价值。下面我自己总结了一下,以供参考。1. FPN解决了什么问题?答: 在以往的faster rcnn进行目标检测时,无论是rpn还是fast rcnn,roi 都作用在最后一层,这在大...转载 2018-07-04 23:41:04 · 9845 阅读 · 1 评论 -
残差网络resnet详解
resnet在2015名声大噪,而且影响了2016年DL在学术界和工业界的发展方向。下面是这个resnet的网络结构,大家先睹为快。 它对每层的输入做一个reference, 学习形成残差函数, 而不是学习一些没有reference的函数。这种残差函数更容易优化,能使网络层数大大加深。我们知道,在计算机视觉里,特征的“等级”随增网络深度的加深而变高,研究表明,网络的深度是实现好的效果的重要因素。然...转载 2018-07-04 16:50:57 · 3852 阅读 · 0 评论 -
CNN中的卷积、反卷积与反池化
1 反卷积DeConvolution 反卷积(Deconvolution)的概念第一次出现是Zeiler在2010年发表的论文Deconvolutional networks中,但是并没有指定反卷积这个名字,反卷积这个术语正式的使用是在其之后的工作中(Adaptive deconvolutional networks for mid and high level feature learning)...原创 2018-06-28 20:29:46 · 18555 阅读 · 1 评论 -
卷积操作的几种类型
卷积操作其实可以分成三种操作:(1)valid 操作,滑动步长为S,图片大小为N1xN1,卷积核大小为N2xN2,卷积后图像大小:(N1-N2)/S+1 x (N1-N2)/S+1如下图: (2)full 操作,滑动步长为1,图片大小为N1xN1,卷积核大小为N2xN2,卷积后图像大小:N1+N2-1 x N1+N2-1 如下图 : (3)same 操作,滑动步长为1,图片大小为N1xN1,卷积核...原创 2018-06-28 20:16:48 · 3309 阅读 · 0 评论 -
实例分割--Mask RCNN详解(ROI Align / Loss Fun)
1 总结架构与主要思想未完待续。。。原创 2018-07-03 16:46:24 · 54370 阅读 · 7 评论 -
Caffe中如何计算卷积
1.caffe中通过构造两个矩阵实现:Caffe中的卷积计算是将卷积核矩阵和输入图像矩阵变换为两个大的矩阵A与B,然后A与B进行矩阵相乘得到结果C(利用GPU进行矩阵相乘的高效性),三个矩阵的说明如下:(1)在矩阵A中 M为卷积核个数,K=k*k,等于卷积核大小,即第一个矩阵每行为一个卷积核向量(是将二维的卷积核转化为一维),总共有M行,表示有M个卷积核。(2)在矩阵B中 ...转载 2018-06-27 20:29:12 · 2387 阅读 · 0 评论 -
CNN中的多通道卷积(RGB等)
卷积过程是对一个通道的图像进行卷积,比如10个卷积核,得到10个feature map, 那么输入图像为RGB三个通道呢,输出就为 30个feature map吗, 答案肯定不是的, 输出的个数依然是卷积核的个数10,只是输出时对RGB三个通道加和。1、 一通道多个卷积核卷积过程:一个卷积核得到的特征提取是不充分的,我们可以添加多个卷积核,比如32个卷积核,可以学习32种特征。在有多个卷积核时,如...转载 2018-06-27 20:00:49 · 23798 阅读 · 2 评论 -
语义分割--FCN中的Shift-and-stitch的详解
当网络最后一层输出的 prediciton map size 和 label map size 不匹配时,除了 cropping, resize 等暴力措施,且不采取 bilinear , uppooling, deconvolution 等decoder 结构, 为了实现 dense prediction , 该怎么做呢?作者在这一段中指出: 为了实现dense prediction ,他们比较...转载 2018-06-27 19:29:54 · 5752 阅读 · 6 评论 -
图像上采样--双线性插值
先看几个概念: 1、图像上采样 上采样upsampling的主要目的是放大图像,几乎都是采用内插值法,即在原有图像像素的基础上,在像素点值之间采用合适的插值算法插入新的元素。2、线性插值法(linear interpolation) 这里讲解线性插值法的推导为了给双线性插值公式做铺垫。 线性插值法是指使用连接两个已知量的直线来确定在这个两个已知量之间的一个未知量的值的方法。 假设已知两...原创 2018-06-27 17:17:43 · 11035 阅读 · 0 评论 -
目标检测--RCNN算法架构及关键技术解析
将之前做的RCNN专题报告分享一下,并留作笔记。PPT介绍了整体结构及四个关键技术:参考资料:1.论文笔记:Rich feature hierarchies for accurate object detection and semantic segmentationhttp://jermmy.xyz/2017/05/08/2017-5-8-paper-notes-rcnn/P:挺好的文章 2.r...原创 2018-06-13 22:35:23 · 517 阅读 · 0 评论 -
FCN实现细节与几个问题
实现细节内容参考这篇文章 1)第一个卷积层为什么需要添加 pad=100 作者提供的网络模型里收个卷积层对输入图像添加了100个像素的边界(图7) 图7. pad:100如果不加100,到 FC6 的卷积输出为h^6=(h^5-7)/1+1=(h-192)/2^5显然对于长或宽不超过192的图片是被办法处理的;添加 p...原创 2018-06-30 10:35:08 · 1803 阅读 · 0 评论 -
语义分割--全卷积网络FCN详解
1.FCN概述图像的语义分割则不仅是区分每个像素的前后景,更需要将其所属类别预测出来,属于计算机视觉领域。CNN做图像分类甚至做目标检测的效果已经被证明并广泛应用,图像语义分割本质上也可以认为是稠密的目标识别(需要预测每个像素点的类别)。传统的基于CNN的语义分割方法是:将像素周围一个小区域(如25*25)作为CNN输入,做训练和预测。这样做有3个问题: - 像素区域的大小如何确定 - 存储及计算...原创 2018-06-29 23:51:47 · 23804 阅读 · 2 评论 -
目标检测--Fast RCNN详解-多细节
Girshick, Ross. “Fast r-cnn.” Proceedings of the IEEE International Conference on Computer Vision. 2015.继2014年的RCNN之后,Ross Girshick在15年推出Fast RCNN,构思精巧,流程更为紧凑,大幅提升了目标检测的速度。在Github上提供了源码。同样使用最大规模的网...原创 2018-06-13 21:41:52 · 3499 阅读 · 0 评论