
Deep Learning
文章平均质量分 87
灰巧克力爱松露
老鸽子了...
展开
-
CRAFT:级联的区域建议网络与快速RCNN结合
Benchmark上采用卷积神经网络提取特征的物体检测,通过改变卷积网络每层的参数似乎已羞于灌水~ 不过依然有人在指标上有一点改进,以国内李子青组的Bin Yang在 CVPR 2016 上发表的文章“CRAFT: Objects from Images”为例,看看基于卷积神经网络的物体检测问题还能怎么展开工作。原创 2016-06-27 09:53:15 · 5345 阅读 · 1 评论 -
使用快速权重来关注最近的过去
Jimmy Ba 及 Geoffrey Hinton 等人的文章“Using Fast Weights to Attend to the Recent Past”。原创 2016-10-31 14:38:10 · 4680 阅读 · 1 评论 -
循环和递归神经网络 (RNN) 与 长短时记忆 (LSTM)
即使不是 NLPer,现实中依然会面对很多序列问题。全文内容来自 Ian Goodfellow, Yoshua Bengio 和 Aaron Courville 3位大老爷的作品“Deep Learning”的其中一章“Sequence Modeling: Recurrent and Recursive Nets”。原创 2016-07-13 10:35:49 · 20234 阅读 · 0 评论 -
Galaxy Zoo Challenge解决方案小结
Galaxy Zoo Challenge解决方案小结1.过拟合如果不过拟合,说明你的网络不够大。模型过拟合问题缓和:(1)数据增强(2)Dropout和权重归一化约束(3)修改网络架构来增加参数共享2.预处理和数据增强a.剪裁和下采样424*424的彩色图像裁剪成207*207,3倍下采样成69*69,使得网络的输入大小可管理。原创 2015-10-17 15:31:52 · 1396 阅读 · 2 评论 -
检测9000类物体的YOLO9000
本想总结一下,看完发现整篇文章多余的话有点少。YOLO的实时性众所周知,所以还等什么,皮皮虾我们走~原创 2017-02-11 12:58:36 · 8706 阅读 · 9 评论 -
对抗的训练来从模拟和无监督图像中学习
来自Ashish Shrivastava等人的文章“Learning from Simulated and Unsupervised Images through Adversarial Training”。原创 2017-02-15 08:52:39 · 4522 阅读 · 2 评论 -
Wasserstein GAN
来自Martin Arjovsky等人的“Wasserstein GAN”。原创 2017-03-12 10:00:48 · 8293 阅读 · 1 评论 -
对抗的深度卷积生成网络来学习无监督表示
Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks.原创 2016-10-03 23:34:16 · 11067 阅读 · 5 评论 -
与判别网络对抗的生成网络 (Generative Adversarial Nets)
Generative Adversarial Nets / GANs原创 2016-10-01 01:11:50 · 9783 阅读 · 11 评论 -
R-FCN:基于区域的全卷积网络来检测物体
CVPR 2016 阅读~ 原文标题为“R-FCN: Object Detection via Region-based Fully Convolutional Networks ”。原创 2016-06-29 14:07:07 · 44441 阅读 · 20 评论 -
反卷积与棋盘效应
来自 Google Brain 的 Augustus Odena 等人的文章“Deconvolution and Checkerboard Artifacts“的部分内容。原创 2016-10-23 23:12:27 · 8709 阅读 · 1 评论 -
Caffe与Lasagne使用——人脸关键点检测
Caffe与Lasagne 使用——人脸关键点检测一. Caffe求解回归问题在使用Lasagne之前,我尝试用Caffe做回归问题。毕竟Lasagne是基于Theano的,所以训练速度上Caffe占优。1. 尝试方法清理掉标签数据中的NaN值后,尝试过下述方法:(1) 输出数据根据最大值和最小值归一化到[0,1]区间内......原创 2016-04-13 17:28:52 · 4250 阅读 · 4 评论 -
Theano入门——CIFAR-10和CIFAR-100数据集
1.CIFAR-10数据集介绍CIFAR-10数据集包含60000个32*32的彩色图像,共有10类。有50000个训练图像和10000个测试图像。数据集分为5个训练块和1个测试块,每个块有10000个图像。测试块包含从每类随机选择的1000个图像。训练块以随机的顺序包含这些图像,但一些训练块可能比其它类包含更多的图像。训练块每类包含5000个图像。类间完全互斥。汽车和卡车类没有重叠。原创 2015-10-09 11:33:47 · 31612 阅读 · 3 评论 -
Theano入门——MNIST数据库
Theano入门——MNIST数据库原创 2015-10-08 23:33:47 · 3647 阅读 · 2 评论 -
Theano入门——Logistic回归
Theano入门——Logistic回归1.Logistic回归介绍参考链接(1)。2.参数设置(1)输入权重w输入权重矩阵的维度需要设置,行图像的大小,列为标签one-hot编码后的大小,cifar-10共有10类,所以为10;mnist标签为0~9,也是10。(2)学习率learning_rate这里为固定学习率。学习率越大收敛越快,但接近结果时可能会跳过最优原创 2015-10-09 17:26:52 · 1166 阅读 · 1 评论 -
Torch学习——开始
Torch学习——开始1. 深度学习框架到目前为止出现了各种各样的深度学习的解决方案框架,其中包括Caffe,CUDA convnet,Pylearn2,Theano,Torch以及TensorFlow等。Caffe和CUDA convnet没用过,不过一直很火的样子,Pylearn2包含了CUDA covnet,入门用Theano,TensorFlow刚出来,谷歌又开始挖坑了,具原创 2015-11-10 21:55:06 · 1359 阅读 · 0 评论 -
Theano入门——卷积神经网络
Theano入门——卷积神经网络1.卷积神经网络介绍参考链接[1]和[3]。2.Theano实现(1)conv2d函数2D卷积。(2)dimshuffle(*pattern)函数置换维度的序列。pattern的举例如下:('x')->0维标量变为1维向量(0,1)->和2维向量们相同(1,0)->第1,2维互换('x',0)->1维向量从原创 2015-10-12 20:43:15 · 3902 阅读 · 0 评论 -
Theano入门——神经网络
Theano入门——神经网络1.神经网络介绍参考链接(1)。2.参数设置(1)模型分层(2)神经网络每层权重维度(3)块大小(4)学习率和动量学习率(5)训练次数3.代码实现(1)权重初始化w_h1,b_h1为神经网络第1层(输入层)的权重和偏置,输入层的输入节点有32*32个,输入层的输出节点有100个。w_h2,b_h2为原创 2015-10-12 20:42:39 · 1698 阅读 · 0 评论 -
Torch学习——使用CUDA
Torch学习——使用CUDA1. CUDA安装CUDA在Ubuntu下的安装[1]还是很方便的。原创 2015-11-12 19:46:21 · 11493 阅读 · 0 评论 -
Torch学习——有监督学习
Torch学习——有监督学习1. 街拍房间号数据集(SVHN)SVHN是对数据预处理和形式要求最小的现实图像集。和MNIST相似,但插入更多有标签数据并且来自1个更加困难,未解决的现实问题(识别自然场景图像中的数字)。SHVN来自谷歌街景图片。(1)简介a. 10类:每类为1个数字,数字1有标签1,数字9有标签9,数字0有标签10。b. 73257幅图像用于训练,26032幅图原创 2015-11-14 11:43:11 · 2867 阅读 · 0 评论 -
Caffe学习——Imagenet分类
Caffe学习——Imagenet分类1. Caffe安装参考Alten Li的Caffe安装[1]。2. Imagenet分类代码来自Caffe的Notebook Examples[2]。在导入Caffe前,先在sys.path中插入Caffe的路径:examples文件夹下有子文件夹pycaffe(猜是安装Caffe时执行“make pycaffe”生成的文件夹),并没原创 2015-12-19 21:09:46 · 4660 阅读 · 1 评论 -
Caffe学习——使用自己的数据(非图像)训练网络
Caffe学习——使用自己的数据(非图像)训练网络1. 鸢尾花卉数据集鸢尾花卉数据集包含150个样本,4个特征(花萼长度,花萼宽度,花瓣长度和花瓣宽度),3个类别(山鸢尾,变色鸢尾和维吉尼亚鸢尾)[1]。2. 所需的准备文件说明(1)prototxt文件xx_deploy.prototxt:设置只有前向计算时网络每层的结构。data层仅定义4原创 2015-12-22 22:55:09 · 14879 阅读 · 57 评论 -
用于视觉识别的卷积神经网络
用于视觉识别的卷积神经网络一.卷积神经网络(CNNs/ConvNets)1.架构概述a.1个卷积网络架构是一系列将图像体积转换成输出体积的层组成;b.层有不同的类型(CONV/FC/RELU/POOL是目前最受欢迎的);c.每层都通过1个可微函数接收1个3D体积且转换成1个输出体积;d.有的层有参数(CONV/FC),有些层则没有(RELU/POOL原创 2015-10-18 23:20:01 · 4145 阅读 · 0 评论