
Deep Learning
文章平均质量分 85
tinyzhao
这个作者很懒,什么都没留下…
展开
-
TensorFlow学习笔记:编程模型
1 计算图在TensorFlow中,算法都被表示成计算图(computational graphs)。计算图也叫数据流图,可以把计算图看做是一种有向图,图中的节点表示操作,图中的边代表在不同操作之间的数据流动。如图所示,左边的图表示z=x+yz=x+y。从图中可以看到,x y z是图中的三个节点,x和y分别有一个箭头指到z,在z节点的下方有一个+号,表明是一个加法操作,因此最后的输出结果就是z=x+原创 2016-10-08 12:49:25 · 10739 阅读 · 0 评论 -
人脸验证:DeepID
《Deep Learning Face Representation from Predicting 10000 Classes》论文解读本文来自香港中文大学汤晓鸥课题组。人脸验证(Face Verification)就是判断两个人脸是不是同一个人,一个常用的场景是判断身份证是不是本人。概述文章使用深度学习的方法来提取人脸高级特征(high-level features),这种特征被称为DeepID原创 2016-11-01 23:19:39 · 10826 阅读 · 2 评论 -
人脸验证:Lightened CNN
《A Lightened CNN for Deep Face Representation》论文解读本文来自中科院,原文地址为: https://arxiv.org/abs/1511.02683代码地址: https://github.com/AlfredXiangWu/face_verification_experiment正如前面《人脸验证:DeepID》博客所说,人脸验证任务中需要原创 2016-11-11 13:10:36 · 8925 阅读 · 1 评论 -
神经网络:Residual Network
《Deep Residual Learning for Image Recognition》论文解读。本文来自于MSRA,作者是大神何凯明。概述本文提出了一种Residual learning的框架,和以前的深层模型比起来,层数要深很多。在ImageNet2015的比赛中,作者使用了152层的网络取得了第一名。随着网络结构的加深,带来了两个问题:一是vanishing/exploding gradi原创 2016-11-16 16:36:37 · 11984 阅读 · 1 评论 -
目标检测:R-CNN
《Rich feature hierarchies for accurate object detection and semantic segmentation》论文解读目标检测问题就是从图片中检测出目标的位置并判断目标的类别,比如人脸检测问题。不过人脸检测问题只是一种专门针对人脸的检测问题,而本文提出的R-CNN是通用目标检测问题,针对20类目标的检测。通用目标检测问题只需要进行适当修改就可以应原创 2016-12-17 23:35:16 · 4158 阅读 · 0 评论 -
目标检测:SPP-net
《Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition》论文解读本文来自Kaiming He大神。上文说到R-CNN的最大瓶颈是2k个候选区域都要经过一次CNN,速度非常慢。Kaiming He大神最先对此作出改进,提出了SPP-net,最大的改进就是只需要将原图输入一次,就可以得到每个候选区域的特原创 2016-12-18 13:29:31 · 13005 阅读 · 0 评论 -
目标检测:Fast R-CNN
《Fast R-CNN》论文解读本文作者是Ross Girshick,和R-CNN作者一样。概述前面提到端到端的检测框架是很难实现的,那么先把除了region proposal的部分统一起来。Fast R-CNN贡献就在于把特征提取,SVM,Bounding box regression统一到一个框架里面了。Fast R-CNN先说点题外话,如何阅读一篇论文?对于深度学习方面的论文,我觉得要关注以下原创 2016-12-19 15:56:43 · 1849 阅读 · 0 评论 -
目标检测:Faster R-CNN
《Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks》论文解读本文来自Shaoqing Ren,看论文作者列表也是天团级配置,Kaiming He, Ross Girshick, and Jian Sun。概述前面的Fast R-CNN已经把特征提取、目标分类和边框回归统一到了一个框架下面,现在原创 2016-12-20 13:54:06 · 2195 阅读 · 0 评论 -
MXNet编译至Android
MXNet版本更新很快,网上别人编译好的动态链接库很快就过时了,经常会出现某些方法不支持或者某个符号无法读取,这时就需要自己动手编译动态连接库so文件。这个地方无论是中文资料还是英文资料都很少原创 2016-11-22 20:38:14 · 5797 阅读 · 2 评论 -
使用TensorFlow实现TCDCN
本文使用TensorFlow实现了TCDCN网络结构,关于TCDCN可以阅读我的另一篇博客[《Facial Landmark Detection by Deep Multi-task Learning》论文解读](http://blog.youkuaiyun.com/tinyzhao/article/details/52730553)。原创 2016-10-07 19:32:46 · 4096 阅读 · 6 评论 -
人脸特征点检测:VanillaCNN
《Facial Landmark Detection with Tweaked Convolutional Neural Networks》论文解读论文地址: http://www.openu.ac.il/home/hassner/projects/tcnn_landmarks/概述如我前面所说,人脸特征点检测是一个回归问题,这个问题需要关注两个方面:一是人脸特征表示,二是回归方法。这次解析的原创 2016-12-10 16:29:42 · 10773 阅读 · 2 评论 -
神经网络:AlexNet
《ImageNet Classification with Deep Convolutional Neural Networks》论文解读本文出自NIPS2012,作者是大神Alex Krizhevsky,属于多伦多大学Hinton组。概述本文提出的神经网络结构被成为AlexNet,在我最近的研究学习中发现,这一结构及其变种在很多任务中都有使用,回过头来重温一下这篇论文仍然是有必要的。归根到底,本文原创 2016-11-04 15:50:09 · 34283 阅读 · 0 评论 -
MXNet获取特征输出
在网上下载的MXNet预训练模型常常是完整的,但是在实际应用中,我们一般只需要网络中某一层作为特征提取,这个时候就需要重建模型,使得最后输出的是特征。加载预训练模型加载模型使用model.FeedForward.load就可以了,其中模型的名字根据自己的模型做适当修改,后面的参数分别是迭代次数和batch大小,需要根据实际模型进行修改:import mxnet as mximport numpy原创 2016-12-02 16:41:28 · 10811 阅读 · 3 评论 -
Caffe模型移植到MXNet
使用caffe的一大好处是有很多的预训练模型,你可以从caffe的model zoo去下载这些模型。那么怎样把caffe的模型转到MXNet中呢?一种最简单也是最有效的方法就是把caffe的模型加载出来,然后对照着模型参数,逐个复制到MXNet对应的模型参数中。这种方法简单有效,但是也是工作量比较大的一种方法。其实MXNet提供了相应的转换工具帮助我们完成这一流程,本文记录一下这种方法。下载caff原创 2016-12-10 16:26:52 · 6617 阅读 · 2 评论 -
神经网络:Network In Network
《Network In Network》论文解读本文来自于新加坡国立大学,原文地址: https://arxiv.org/abs/1312.4400概述本文提出了一种叫Network in Network的网络结构,主要贡献有两个:一是mlpconv网络结构,一是Global average pooling结构。网络结构网络总体的结构如图所示,前面使用了3个mlpconv层,在输出的时候使用了原创 2016-11-13 12:00:27 · 1011 阅读 · 0 评论 -
神经网络:GoogLeNet
《Going Deeper with Convolutions》论文解读本文提出了GoogLeNet的网络结构,在ILSVRC2014取得了最好的成绩。本文和Network In Network一样,对网络中的传统卷积层进行了修改,提出了被称为Inception的结构。Motivation提高深度神经网络性能的关键在于增加深度和宽度。但是大的网络存在3个主要问题:发生过拟合,计算资源不足,稀疏的数据原创 2016-11-14 11:29:07 · 1957 阅读 · 0 评论 -
人脸特征点检测:TCDCN
这篇文章发表于ECCV2014,作者单位是香港中文大学汤晓鸥课题组。论文原文见: http://mmlab.ie.cuhk.edu.hk/projects/TCDCN.html概述文章提出了人脸特征点检测的新方法,使用与人脸相关的属性共同学习人脸的特征点位置。 we wish to optimize facial landmark detection together with heter原创 2016-10-03 23:59:38 · 14457 阅读 · 5 评论