
深度学习
_飞奔的蜗牛_
关注图像处理/机器视觉/机器学习/大数据 等领域
学海无涯,与时俱进。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
caffe源码学习(2)-softmax loss层
与softmax回归相关的caffe源码主要在如下两个文件中:softmax_loss_layer.cpp和softmax_layer.cpp。 softmax_loss_layer.cpp 前向计算后向计算://softmax_loss_layer.cpp 前向计算后向计算template <typename Dtype>void SoftmaxWithLossLayer<Dtype>::原创 2016-12-29 10:56:32 · 2181 阅读 · 0 评论 -
caffe深度学习-windows下绘制学习曲线
在windows下绘制学习曲线。1、获取训练日志文件1)设置好solver.prototxt ,train_test.prototxt等配置文件 2)建立批处理文件(.bat),将输出至屏幕的训练信息,重定性至文件。 train.bat 配置如下:e:cd E:\deeplerning\caffe\caffe-windows\My //转换至工作目录,日志文件将保存在此目录E:\de原创 2017-04-09 17:14:27 · 2939 阅读 · 0 评论 -
caffe in python ---Classification
参考官方文档:http://nbviewer.jupyter.org/github/BVLC/caffe/blob/master/examples/00-classification.ipynb#-*- coding: utf-8 -*-import numpy as npimport matplotlib.pyplot as plt# display plots in this noteb翻译 2017-08-19 23:11:57 · 588 阅读 · 0 评论 -
python-caffe接口学习(Solving in Python with LeNet)
参考官方链接: http://nbviewer.jupyter.org/github/BVLC/caffe/blob/master/examples/01-learning-lenet.ipynb[(k, v.data.shape) for k, v in solver.net.blobs.items()] // 利用此命令,可查看featuremap/* // solver.原创 2017-08-17 00:14:10 · 594 阅读 · 0 评论 -
caffe 输出信息分析+debug_info
1 caffe输出基本信息caffe在训练的时候屏幕会输出程序运行的状态信息,通过查看状态信息方便查看程序运行是否正常,且方便查找bug. caffe debug信息默认是不开启的,此时的输出信息的总体结构如下所示: 1.1 solver信息加载并显示1.2 train网络结构输出1.3 Train 各层创建状态信息I0821 09:53:35.572999 10308 laye原创 2017-08-21 14:02:45 · 5314 阅读 · 0 评论 -
caffe之deconv
卷积与反卷积的直观感受: 卷积: 反卷积: 特别说明,此处分析的反卷积主要针对 caffe中DeconvolutionLayer类别来说。反向传播分析,参考博客: https://grzegorzgwardys.wordpress.com/2016/04/22/8/ http://www.jefkine.com/general/2016/09/05/backpropagation-in-c原创 2017-08-26 12:15:04 · 4240 阅读 · 0 评论 -
caffe添加C++层和python层定义
caffe的网络层类型注册机制。 我们知道,caffe中有很多网络层(layer),每个层并单独定义成一个c++类,如卷积层class ConvolutionLayer、class PoolingLayer等。当我们自定义一个层结构,该如何融入caffe架构里去呢?为了实现这个目的,需要首先了解一下caffe层的构建机制。1. 编写源文件及头文件首先,编写自己类(Mytest)的头文件、源文件:M原创 2017-09-06 17:10:31 · 2507 阅读 · 1 评论 -
全卷积网络FCN几点认识
FCN全卷积网络,作为语义分割的鼻祖,研究了一下,但是,其中几个问题一直没有想明白,现汇总一下。 1、首个卷积层为什么pad=100 ?我们从VGG16网络结构中探究原因。 VGG16的特点是,conv5之前的卷积层均使用卷积核 kernel_size=3,pad=1,因此,卷积前后不改变数据尺寸,改变featrueMap的尺寸只有pooling层。 现在我们只考虑pooling层,所有p原创 2017-09-04 10:38:07 · 897 阅读 · 0 评论 -
FCN测试结果
刚刚跑完FCN网络,先上几张图展示一下效果,效果还是挺不错。 以sift-flow数据集为例。 原图 分割结果如上所示,道路、山峰和天空均分割出来了。原创 2017-09-07 14:19:41 · 2023 阅读 · 4 评论 -
faster-rcnn小刀
最近又把大神的faster rcnn程序搬出来,有点小感悟,小发现。 非极大值抑制NMS,绝逼是个好东西,说明如下。proposal输出结果 原始的proposal输出结果如下: 疑似目标区域,如上,这是在逗我么,一团乱麻(6000个候选框)。经过非极大值抑制之后: 啥感觉,是不是有点眉目了,NMS功不可没。但是,说实话,结果依然很凌乱,其实仅从性能来说,相比Selective Search原创 2017-09-14 23:52:57 · 521 阅读 · 0 评论 -
【目标检测】[论文阅读][yolo] You Only Look Once: Unified, Real-Time Object Detection
论文名称《You Only Look Once: Unified, Real-Time Object Detection》摘要1、之前的目标检测方法采用目标分类思想解决检测问题,本文提出一个基于回归的框架,用于目标的定位及识别。2、一个网络,一次预测即可获得目标的检测框(bounding boxs)和 类别概率。3、所提目标检测框架运算速度非常快。基本YOLO 模型45帧/S。简化版本Fast原创 2017-09-24 15:59:47 · 1333 阅读 · 0 评论 -
dropout个人理解
1、dropout中概率参数p,是指单个神经元被丢弃的概率。 2、训练阶段droup的开关放在激活值之后, 3、测试阶段,每个激活值后乘以q(保留概率),以此来缩放激活函数。 4、某一层有n个神经元,则一次迭代丢弃的神经元个数是不确定的,它是个随机变量,服从二项分布。 5、经过多轮训练,某层神经元平均丢弃的个数为概率为n*p。 6、在n*p处的概率最大,并以p=0.5为左右对称分布。原创 2017-09-10 11:31:56 · 1006 阅读 · 0 评论 -
SSD windows版本配置
1、参考博文中windows版本的配置流程 http://m.blog.youkuaiyun.com/qq_14845119/article/details/53331581 2、编译生成 python 版本的 caffe ,并将其放在 site-packages目录下 3、下载 作者已经训练好的模型 http://www.cs.unc.edu/~wliu/projects/SSD/mo原创 2017-08-01 15:23:15 · 2040 阅读 · 1 评论 -
关于caffe的笔记
1、利用caffe训练期间,内存需要多少,内存中都保存了学什么?内存需要保存一个训练周期中的所有 feature map 数据+网络参数数据 受bach_size 及网络模型大小关系较大。2、利用训练好的模型文件.caffemodel如何初始化网络模型文件 .prototxt?matlab 接口: net=caffe.Net() net.copy_from()caffe 源码解释: 调用原创 2017-07-19 00:09:27 · 1140 阅读 · 0 评论 -
yolo源码学习 1
yolo源码学习原创 2017-05-06 17:41:23 · 439 阅读 · 0 评论 -
caffe 源码学习(4)_反向传播权重更新
还是以mnist手写字符,lenet5为例。 如上图所示,左边为9个layer层,右边为每层的top blob 的输出(featrue map)的维度。那么问题来了,训练的参数wij和biw_{ij}和b_i存在哪些变量里呢? 1)有需要用BP算法进行训练参数的层(layer),内部都会有一个成员变量layer::blobs_,其中blobs_[0]存放wijw_{ij}及Δwij\Del原创 2017-01-02 23:11:51 · 2918 阅读 · 0 评论 -
caffe-windows下使用pycaffe绘制网络图
博主所用caffe在windows下编译生成。配置环境说明 - 编译器:vs2013 - 操作系统:win10-64bit - caffe-windows - python2.7(64bit)1 编译pycaffe1.1 配置 CommonSettings.props 中是能python接口功能:< PythonSupport >为true<?xml version="1.0" encodi原创 2017-01-03 22:17:00 · 1056 阅读 · 0 评论 -
caffe源码学习(1)-矩阵向量运算
占坑!原创 2016-12-13 16:43:37 · 1459 阅读 · 0 评论 -
caffe源码学习(3)--卷积层
以手写字符集mnist为例介绍caffe卷积层的实现方式。1.卷积层C1 源码在卷积层类ConvolutionLayer中,batch(训练 64*3*28*28,测试 100*3*28*28)中每个样本循环调用前向运算ConvolutionLayer::Forward_cpu()函数计算featrue map。 函数源码如下:template <typename Dtype>void Co原创 2016-12-30 20:09:07 · 1121 阅读 · 1 评论 -
深度学习服务器 RAID5做Rebuild
为了扩展深度学习服务器硬盘容量,在服务器开机状态下将阵列硬盘拔下来一个,造成磁盘报警。 1、指示灯闪烁并报警 2、Degrade 状态 插入新盘后,等待Rebuild。 若干时间后,Rebuild 成功,所有硬盘都成为Online状态。原创 2017-02-10 20:17:07 · 11262 阅读 · 0 评论 -
caffe-windows下matcaffe接口配置
上一篇介绍了pycaffe接口的配置及使用,本文梳理一下caffe的matlab接口配置方法。在CommonSettings.props 打开matlab接口开关 <!-- NOTE: If Matlab support is enabled, MatlabDir (below) needs to be set to the root of your Matla原创 2017-01-04 00:03:30 · 1208 阅读 · 0 评论 -
matcaffe 使用中,matlab直接错误退出问题
1、首先需要配置matlab接口环境,并定义是否开启GPU加速 caffe.set_mode_gpu(); %GPU加速模式 caffe.set_mode_cpu(); %CPU加速模式 如果没有配置成功,则会报错:无法找到caffe_2、加载训练好的模型 net = caffe.Net(net_model,weight,’test’) net_model 通常为deploy.prot原创 2017-04-06 23:29:59 · 4381 阅读 · 4 评论 -
caffe权值及featureMap可视化
1、权值可视化主函数 conv1_weights_vis.m,放在caffe根目录,需要matcaffeclear;clc;close all;addpath('matlab')caffe.set_mode_cpu();fprintf(['Caffe Version = ', caffe.version(), '\n']);net = caffe.Net('models/bvlc_refe转载 2017-04-05 21:07:38 · 3555 阅读 · 0 评论 -
libcaffe Check failed: registry.count(type) == 1 (0 vs. 1) Unknown layer type: Input (known types: )
在用libcaffe.lib建立工程时,出现 Check failed: registry.count(type) == 1 (0 vs. 1) Unknown layer type: Input (known types: )错误,参考了两篇博文解决问题: 主要思想是增加 头文件,注册layer层。 http://blog.youkuaiyun.com/birdwcp/article/deta转载 2017-04-19 22:44:41 · 3542 阅读 · 5 评论 -
faster rcnn配置 cuda8.0
参考博客: http://blog.youkuaiyun.com/sinat_30071459/article/details/505468911、编译caffe-faster rcnn库 Caffe for Faster R-CNN 编译过程: 1)下载caffe_library.zip 2)将caffe-faster rcnn库中的所有文件copy至./caffe原创 2017-05-02 19:17:03 · 950 阅读 · 0 评论 -
VOC-2007数据集
1 VOC2007基本信息作为标准数据集,voc-2007 是衡量图像分类识别能力的基准。 faster-rcnn,yolo -v1, yolo-v2都以此数据集为最为演示样例,因此,有必要了解一下本数据集的组成架构。VOC数据集共包含:训练集(5011幅),测试集(4952幅),共计9963幅图,共包含20个种类。 aeroplane bicycle bird boat原创 2017-05-04 22:52:29 · 15637 阅读 · 2 评论 -
SSD 源码(1)
训练数据加载,与读取:主要由 AnnotatedDataLayer 承担其构造函数如下:template <typename Dtype>AnnotatedDataLayer<Dtype>::AnnotatedDataLayer(const LayerParameter& param) : BasePrefetchingDataLayer<Dtype>(param), reader_(原创 2017-10-01 08:25:33 · 1490 阅读 · 0 评论