
深度学习(deep learning)
文章平均质量分 55
marleylee
每一个不曾起舞的日子,都是对生命的辜负!
展开
-
使用多任务学习方法进行人脸特征点和属性检测
前言这篇文章总结一下最近的工作,参考展鹏大神的14年论文[ECCV2014]Facial Landmark Detection by MultiTask15年的论文在14年的基础上做了进一步的优化,输入图像更大了,可以关注一下。[IEEE15]Learning Deep Representation for Face Alignment with Auxiliary Attribu转载 2017-08-02 19:24:04 · 2058 阅读 · 3 评论 -
RCNN学习笔记(3):Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition(SPP-net)
基础框架:CNN网络需要固定尺寸的图像输入,SPPNet将任意大小的图像池化生成固定长度的图像表示,提升R-CNN检测的速度24-102倍。固定图像尺寸输入的问题,截取的区域未涵盖整个目标或者缩放带来图像的扭曲。事实上,CNN的卷积层不需要固定尺寸的图像,全连接层是需要固定大小输入的,因此提出了SPP层放到卷积层的后面,改进后的网络如下图所示:SPP是BOW的扩展,将图像从精细转载 2017-08-13 19:48:31 · 491 阅读 · 0 评论 -
RCNN学习笔记(4):fast rcnn
reference link:http://zhangliliang.com/2015/05/17/paper-note-fast-rcnn/http://blog.youkuaiyun.com/shenxiaolu1984/article/details/51036677http://blog.youkuaiyun.com/qq_26898461/article/details/50906926以下转载 2017-08-13 19:49:47 · 515 阅读 · 0 评论 -
RCNN学习笔记(5):faster rcnn
reference link:http://blog.youkuaiyun.com/shenxiaolu1984/article/details/51152614http://blog.youkuaiyun.com/luopingfeng/article/details/51245694http://blog.youkuaiyun.com/xyy19920105/article/details/50817725转载 2017-08-13 19:52:50 · 329 阅读 · 0 评论 -
RCNN学习笔记(6):Faster R-CNN 英文论文翻译笔记
reference link:http://blog.youkuaiyun.com/liumaolincycle/article/details/48804687摘要目前最先进的目标检测网络需要先用区域建议算法推测目标位置,像SPPnet[7]和Fast R-CNN[5]这些网络已经减少了检测网络的运行时间,这时计算区域建议就成了瓶颈问题。本文中,我们介绍一种区域建议网络(Region转载 2017-08-13 19:55:32 · 757 阅读 · 0 评论 -
RCNN学习笔记(7):You Only Look Once(YOLO):Unified, Real-Time Object Detection
Reference link: http://blog.youkuaiyun.com/tangwei2014这是继RCNN,fast-RCNN 和 faster-RCNN之后,rbg(Ross Girshick)大神挂名的又一大作,起了一个很娱乐化的名字:YOLO。 虽然目前版本还有一些硬伤,但是解决了目前基于DL检测中一个大痛点,就是速度问题。 其增强版本GPU中能跑45fps,简化版本155fps转载 2017-08-14 09:44:28 · 313 阅读 · 0 评论 -
RCNN学习笔记(8):OverFeat:Integrated Recognition, Localization and Detection using Convolutional Network
Reference link: http://blog.youkuaiyun.com/whiteinblue/article/details/43374195https://www.zybuluo.com/coolwyj/note/203086#1-classification 本文是纽约大学Yann LeCun团队中Pierre Sermanet ,David Eigen和张翔等在转载 2017-08-14 09:44:52 · 836 阅读 · 0 评论 -
RCNN学习笔记(9):SSD:Single Shot MultiBox Detector
之前一直想总结下SSD,奈何时间缘故一直没有整理,在我的认知当中,SSD是对Faster RCNN RPN这一独特步骤的延伸与整合。总而言之,在思考于RPN进行2-class分类的时候,能否借鉴YOLO并简化faster rcnn在21分类同时整合faster rcnn中anchor boxes实现multi-scale的思想而设计出了SSD,这篇blog关于SSD的细节方面整理的很好,以供参考。转载 2017-08-14 09:45:12 · 745 阅读 · 0 评论 -
RCNN学习笔记(10):Fully Convolutional Networks for Semantic Segmentation(全卷积网络FCN)
Reference link: http://blog.youkuaiyun.com/tangwei2014http://blog.youkuaiyun.com/u010025211/article/details/51209504概览&主要贡献提出了一种end-to-end的做semantic segmentation的方法,简称FCN。如下图所示,直接拿segmen转载 2017-08-14 09:46:33 · 705 阅读 · 0 评论 -
RCNN学习笔记(11):R-FCN: Object Detection via Region-based Fully Convolutional Networks
转自:http://blog.youkuaiyun.com/shadow_guo/article/details/51767036作者代季峰 1,14年毕业的清华博士到微软亚洲研究院的视觉计算组,CVPR 16 两篇一作的会议主持人同时公布了源码~ 21. 简介物体检测的深度网络按感兴趣区域 (RoI) 池化层分为两大主流:共享计算的全卷积子网络 (每个子网络与 RoI 无转载 2017-08-14 09:46:56 · 382 阅读 · 0 评论 -
卷积神经网络——输入层、卷积层、激活函数、池化层、全连接层
转自:https://blog.youkuaiyun.com/qq_27022241/article/details/78289083卷积神经网络(CNN)由输入层、卷积层、激活函数、池化层、全连接层组成,即INPUT(输入层)-CONV(卷积层)-RELU(激活函数)-POOL(池化层)-FC(全连接层)卷积层用它来进行特征提取,如下: 输入图像是32*32*3,3是它的深度(即R...转载 2018-07-30 23:46:21 · 45679 阅读 · 2 评论 -
win7/Windows10+CUDA8.0+VS2013/VS2015+CUDNN5.1/cudnn7下配置 caffe GPU版本
一、环境确定右击计算机属性、设备管理器查看显示适配器电脑是否配置GPU,如果有,建议配置GPU,Caffe运行速度会快很多二 、安装英伟达显卡驱动+VS+cuda+cudnn具体参考:https://blog.youkuaiyun.com/marleylee/article/details/81988365三、下载官方caffe-windows并解压版本链接https://github.c...原创 2018-11-29 15:24:24 · 882 阅读 · 0 评论 -
No module named 'caffe',anaconda+caffe安装
一、在VS下编译caffe参考:https://blog.youkuaiyun.com/marleylee/article/details/84631762二、安装anaconda我需要用python2,所以安装的时anaconda2,按自己需求安装即可三、配置caffe的python接口将编译好的python的caffe文件拷贝到python安装目录C:\ProgramData\Anac...原创 2018-11-29 15:39:10 · 1771 阅读 · 0 评论 -
RCNN学习笔记(2):Rich feature hierarchies for accurate object detection and semantic segmentation
reference link: http://blog.youkuaiyun.com/hjimce/article/details/50187029一、相关理论 本篇博文主要讲解2014年CVPR上的经典paper:《Rich feature hierarchies for Accurate Object Detection and Segmentation》,这篇文章的算法思想又被称之为:R转载 2017-08-13 19:45:52 · 475 阅读 · 0 评论 -
RCNN学习笔记(1):Rich feature hierarchies for accurate object detection and semantic segmentation
rcnn主要作用就是用于物体检测,就是首先通过selective search 选择2000个候选区域,这些区域中有我们需要的所对应的物体的bounding-box,然后对于每一个region proposal 都wrap到固定的大小的scale,227*227(AlexNet Input),对于每一个处理之后的图片,把他都放到CNN上去进行特征提取,得到每个region proposal的f转载 2017-08-13 19:43:49 · 546 阅读 · 0 评论 -
RCNN学习笔记(0):rcnn简介
reference link: http://blog.youkuaiyun.com/shenxiaolu1984/article/details/51066975Region CNN(RCNN)可以说是利用深度学习进行目标检测的开山之作。作者Ross Girshick多次在PASCAL VOC的目标检测竞赛中折桂,2010年更带领团队获得终身成就奖,如今供职于Facebook旗下的FAIR。转载 2017-08-13 19:40:39 · 325 阅读 · 0 评论 -
深度学习框架的比较(MXNet, Caffe, TensorFlow, Torch, Theano)
转自 http://blog.youkuaiyun.com/myarrow/article/details/520646081. 基本概念1.1 MXNet相关概念 深度学习目标:如何方便的表述神经网络,以及如何快速训练得到模型 CNN(卷积层):表达空间相关性(学表示) RNN/LSTM:表达时间连续性(建模时序信号) 命令式编程(im转载 2017-08-11 14:33:06 · 2051 阅读 · 0 评论 -
caffe学习:CIFAR-10
前段时间一直在弄tensorflow,现在实习公司项目需要对比tensorflow与caffe在图像分类上哪个更好,所以小编我现在只能先把tensorflow放一边,搞一搞caffe。网上有很多这样的资源,可是大家写的都一样,运行起来还有好多没有写明白的,为了以后再用到,同时方便像我这样的新手学习,我将把我在caffe上运行CIFAR-10例子的过程尽可能的写的详细一点。先简单介绍转载 2017-08-18 19:40:30 · 504 阅读 · 0 评论 -
caffe再见之训练自己的数据
Caffe的数据格式采用leveldb或者lmdb格式 本文采用数据为已标定过的彩色图像,共1000张训练图共10个类别,200张测试图像10个类别,下载地址:http://pan.baidu.com/s/1hsvz4g8。 第一步:数据格式转换 1.编译conver_imageset,在\Caffe-Master\Build\x64\Release下转载 2017-08-18 19:42:21 · 398 阅读 · 0 评论 -
caffe之训练数据格式
原文地址:http://blog.youkuaiyun.com/hjimce/article/details/49248231作者:hjimcecaffe对于训练数据格式,支持:lmdb、h5py……,其中lmdb数据格式常用于单标签数据,像分类等,经常使用lmdb的数据格式。对于回归等问题,或者多标签数据,一般使用h5py数据的格式。当然好像还有其它格式的数据可用,不过我一般使用这两种数据格式,转载 2017-08-18 19:45:42 · 2429 阅读 · 0 评论 -
Caffe 源码添加多标签
Caffe 的源码仅适用于模式分类问题,其标签是一维的。为了能够将 Caffe 代码应用于车辆的检测问题上,首先要解决的问题就是将 Caffe 源码中与标签相关的代码由一维改为多维。本项目由于只需预测车辆的上下两角的坐标(x1,y1, x2,y2),即将标签修改为4维。这次能够很顺利的修改源码,很大一原因是实验室的师弟太给力了,他们对 Caffe 源码的研究开始地很早,并在以 Caff转载 2017-08-18 19:47:05 · 591 阅读 · 0 评论 -
Caffe学习笔记——Caffe的三级结构(Blobs,Layers,Nets)
根据Caffe官方文档介绍,caffe大致可以分为三层结构blob,layer,net。数据的保存,交换以及操作都是以blob的形式进行的,layer是模型和计算的基础,net整和并连接layer。BlobsBlob是Caffe的基本数据结构,具有CPU和GPU之间同步的能力,它是4维的数组(Num, Channels, Height, Width)。设Blob数据维度为 nu转载 2017-08-18 19:50:38 · 549 阅读 · 0 评论 -
Caffe中卷积的实现细节(涉及到BaseConvolutionLayer、ConvolutionLayer、im2col等)
文章地址:http://blog.youkuaiyun.com/xizero00/article/details/51049858一、 卷积层的作用简介卷积层是深度神经网络中的一个重要的层,该层实现了局部感受野,通过这种局部感受野,可以有效地降低参数的数目。我们将结合caffe来讲解具体是如何实现卷积层的前传和反传的。至于是如何前传和反传的原理可以参考Notes on Conv转载 2017-08-18 19:53:25 · 769 阅读 · 0 评论 -
caffe绘制训练过程的loss和accuracy曲线
在caffe的训练过程中,大家难免想图形化自己的训练数据,以便更好的展示结果。如果自己写代码记录训练过程的数据,那就太麻烦了,caffe中其实已经自带了这样的小工具 caffe-master/tools/extra/parse_log.sh caffe-master/tools/extra/extract_seconds.py和 caffe-master/tools/extra/plot_tra转载 2017-08-18 19:55:18 · 472 阅读 · 0 评论 -
caffe中使用crop_size剪裁训练图片
layer { name: "data" type: "Data" top: "data" top: "label" include { phase: TRAIN } transform_param { mirror: t转载 2017-08-19 12:37:15 · 1365 阅读 · 0 评论 -
caffe中solver.prototxt参数说明
http://www.cnblogs.com/denny402/p/5074049.htmlsolver算是caffe的核心的核心,它协调着整个模型的运作。caffe程序运行必带的一个参数就是solver配置文件。运行代码一般为# caffe train --solver=*_slover.prototxt在Deep Learning中,往往loss function是转载 2017-08-19 12:39:17 · 607 阅读 · 0 评论 -
DPM(Deformable Parts Model)--原理(一)
原文转载自:http://blog.youkuaiyun.com/ttransposition/article/details/12966521DPM(Deformable Parts Model)Reference:Object detection with discriminatively trained partbased models. IEEE Trans转载 2017-08-13 19:08:31 · 613 阅读 · 0 评论 -
DPM(Defomable Parts Model) 源码分析-检测(二)
原文转载自:http://blog.youkuaiyun.com/ttransposition/article/details/12954195DPM(Defomable Parts Model)原理首先声明此版本为V3.1。因为和论文最相符。V4增加了模型数由2个增加为6个,V5提取了语义特征。源码太长纯代码应该在2K+,只选取了核心部分代码demo.m转载 2017-08-13 19:11:13 · 347 阅读 · 0 评论 -
DPM(Defomable Parts Model) 源码分析-训练(三)
原文转载自:http://blog.youkuaiyun.com/ttransposition/article/details/12954631DPM(Defomable Parts Model)原理首先调用格式:example:pascal('person', 2); % train and evaluate a 2 component person mo转载 2017-08-13 19:12:50 · 344 阅读 · 0 评论