
深度学习
文章平均质量分 56
thesby
这个作者很懒,什么都没留下…
展开
-
深度学习之caffe安装历险记
这次成功安装了caffe,非常开心,哈哈!这篇文章主要就是记录下我的安装过程,帮助下还没安装成功的童鞋们!平台:win7 64bit中文旗舰版 + VS2013 + caffecaffe本来是需要在Linux下编译的,感谢那些把它移植到windows的大神。但是不管在windows下还是Linux下安装都是十分困难,我这次在windows下安装花了整整一天的时间,本来打算放弃的,因为最后原创 2015-01-31 09:56:10 · 9644 阅读 · 7 评论 -
梯度下降算法概述
梯度下降算法概述本文是翻译的 An overview of gradient descent optimization algorithms,翻译时并不一定遵照原文的表述,主要是以将问题表达清楚为主要目的。翻译 2016-08-31 13:52:29 · 1104 阅读 · 0 评论 -
目标检测论文回顾
看了一段时间的目标检测的论文,在这里写个文章总结一下吧。不一定理解正确,如有问题,欢迎指正。1、RCNNRCNN是基于selective search(SS) 搜索Region proposal(RP),然后对每个RP进行CNN的Inference,这个算法比较直接。 框架应该也挺容易看明白的。 SS对每幅图片提取大约2K个RP,然后对RP进行推理。2、SPPNETRCNN的计算很多是没有必原创 2016-09-24 23:02:01 · 4476 阅读 · 4 评论 -
Recent Advances in Convolutional Neural Networks
这篇博客是对Recent Advances in Convolutional Neural Networks这篇论文的一个解读感悟,不是翻译,只是解读。简介CNN从AlexNet,到VGG,GoogleNet,再到ResNet,网络层次不断在加深,而且拓扑结构也越来越复杂,其面临的目标优化、过拟合等问题也越来越难解决。基本概念卷积 卷积其实就是一个不断滑动的矩阵对应位置的点乘(不考虑旋转180°)原创 2016-09-24 23:49:26 · 2617 阅读 · 0 评论 -
在可视化环境下进行Caffe网络设计
本来说不再写这种太low的博文,要写点高大上的东西,无奈,有时候一些小工具小技巧还不错,还是希望分享出来。所以就水一篇技术博文吧。本文主要是讲如何在可视化环境下进行caffe的网络设计。如果你有网可用的话,直接进入传送门,接下来的东西与你无关。如果需要在本地使用,就要进行如下操作了。下载https://github.com/ethereon/netscope,不管是直接下载还是git clone。原创 2016-09-27 16:51:13 · 1214 阅读 · 0 评论 -
DeepLab论文解读
论文:DeepLab: Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution, and Fully Connected CRFs论文核心:这篇文章主要讲了在做DCNN时遇到的三个挑战以及他们是如何解决的。预习内容:这个论文是做语义分割的,如果没有读过其他的语义分割论文,可能需要先补习一下(传送门)。F原创 2016-09-29 10:46:05 · 10389 阅读 · 0 评论 -
ParseNet论文解读
导言其实图像语义分割和目标检测如果对比起来看到话,基本上是一样的任务。目标检测需要定位目标并找到最准确的框,而语义分割是把目标分割出来。由此可见,语义分割是比目标检测更困难的任务。有时候并不需要分割出目标,只需要框出来就可以了,比如行人检测,就不一定要把它分割出来,所以目标检测的算法用途也很广泛。如果对比目标检测和语义分割的论文的话,基本上是面对着相似的问题。ParseNet和SSD是同一个作者做的原创 2016-09-29 13:37:18 · 6452 阅读 · 1 评论 -
caffe中使用python layer
在上一篇博文中已经介绍了很多如何在caffe中使用python 层。有一些人问到如何使用这些层。 首先需要在编译caffe时,允许python layer,在配置文件中设置。 写好自己的层之后,需要 export $PYTHONPATH=./path/to/my_layers_dir:$PYTHONPATH 这样才能找到你的python文件。 然后module这个参数就是你的文件名原创 2016-11-16 21:28:34 · 4039 阅读 · 2 评论 -
深度学习中的数据扩增方法
图像平移。这种方法可以使得网络学习到平移不变的特征。图像旋转。学习旋转不变的特征。有些任务里,目标可能有多种不同的姿态,旋转正好可以弥补样本中姿态较少的问题。图像镜像。和旋转的功能类似。图像亮度变化。裁剪。缩放。原创 2016-11-14 20:43:36 · 9313 阅读 · 0 评论 -
Deep learning 资料汇总--持续更新
这篇博客主要是把自己了解到的一些深度学习理论及应用方面的资料整合起来,方便以后查阅。1 Deep learning 概述1、Understanding Aesthetics with Deep Learning https://devblogs.nvidia.com/parallelforall/understanding-aesthetics-deep-learning/2、Sequence l原创 2016-05-11 20:44:27 · 1092 阅读 · 0 评论 -
CRF as RNN 代码解读
论文:http://www.robots.ox.ac.uk/~szheng/papers/CRFasRNN.pdf, CRF as RNN论文的代码在https://github.com/bittnt/caffe/tree/6a29e7c484ed0ef22224e7b7b555fbc5b4045cc3可以找到。 这篇博文主要是记录自己对CRF as RNN中的 MultiStageMeanfi原创 2016-06-06 10:16:11 · 6385 阅读 · 2 评论 -
Caffe修炼之路--模型定义
平台 Ubuntu14.04LTS这篇博客主要是讲讲我学习caffe中LeNet MNIST示例的心得。1、第一层:数据层layers { name: "mnist" type: DATA data_param { source: "mnist_train_lmdb" backend: LMDB batch_size: 64 scale:原创 2015-02-05 21:59:00 · 4287 阅读 · 0 评论 -
CXXNET 安装教程
cxxnet详细安装教程原创 2015-03-21 16:10:22 · 4805 阅读 · 2 评论 -
caffe boost cuda __float128 undefined
今天编译caffe-master时遇到新的问题,__float128未定义,使用到cuda版本为7.5.18,boost为1.60,gcc为4.8,opencv为3.1,操作系统为ubuntu14.04,报错如下:/usr/local/include/boost/config/suffix.hpp(510): error: identifier "__float128" is undefined1原创 2016-01-13 19:58:29 · 5945 阅读 · 0 评论 -
深度卷积网络CNN与图像语义分割
说好的要笔耕不缀,这开始一边实习一边找工作,还摊上了自己的一点私事困扰,这几个月的东西都没来得及总结一下。这就来记录一下关于CNN、Caffe、Image Sematic Segmentation相关的工作,由于公司技术保密的问题,很多东西没办法和大家详说只能抱歉了。在5月份前,我也是一个DL和CNN的门外汉,自己试着看tutorials、papers、搭Caffe平台、测试CNN Net,现在至转载 2016-03-21 16:13:30 · 1590 阅读 · 0 评论 -
在win10 64 bit上安装theano
在windows10上安装theano,步骤如下: 1、准备工作。先安装Anaconda 64位。然后运行conda install mingw libpython2、先安装pycuda,可以去官网上下载最新版本的。1)解压后,用命令行进入目录。2)运行 python configure.py3)然后打开siteconf.py,编辑对应的内容,比如我的:BOOST_INC_DIR = [r"D原创 2016-03-23 01:50:43 · 2195 阅读 · 0 评论 -
Ubuntu14.04上深度学习Caffe库安装指南(CUDA7.5 + opencv3.1)
Ubuntu14.04 + CUDA7.5 + Opencv 3.1安装 Caffe教程原创 2016-03-13 20:10:32 · 3423 阅读 · 0 评论 -
CRF图像分割简介
这里主要是讲Conditional Random Fields(CRF)用于pixel-wise的图像标记(其实就是图像分割)。CRF经常用于 pixel-wise的label 预测。当把像素的label作为形成马尔科夫场随机变量且能够获得全局观测时,CRF便可以对这些label进行建模。这种全局观测通常就是输入图像。令随机变量XiX_i是像素ii的标签。 Xi∈L={l1,l2,...,lL}X原创 2016-03-24 10:53:36 · 20234 阅读 · 4 评论 -
开源深度学习库对比总结
原创 2016-05-16 14:53:14 · 2952 阅读 · 0 评论 -
win10 安装 tensorflow gpu 版
先打开网址https://storage.googleapis.com/tensorflow 可以看到目前的所有tensorflow已编译版本。直接翻到最后面,找到windows的。比如当前最新的为:<Contents><Key>windows/gpu/tensorflow_gpu-1.0.0rc0-cp35-cp35m-win_amd64.whl</Key><Generation>148原创 2017-01-30 11:24:21 · 2258 阅读 · 0 评论