
深度学习基础知识
深度学习基础知识积累
咆哮的大叔
给儿子树立一个爱写博客的好榜样。
展开
-
译《Notes on Convolutional Neural Networks》
译《Notes on Convolutional Neural Networks》来自:http://blog.youkuaiyun.com/zouxy09一、介绍 这个文档讨论的是CNNs的推导和实现。CNN架构的连接比权值要多很多,这实际上就隐含着实现了某种形式的规则化。这种特别的网络假定了我们希望通过数据驱动的方式学习到一些滤波器,作为提取输入的特征的一种转载 2016-07-18 15:54:46 · 1694 阅读 · 0 评论 -
对象表示与特征表达
来自object tracking: a survey原创 2016-03-27 21:03:11 · 1582 阅读 · 0 评论 -
视频理解研究
相比较于视频研究,基于深度学习的图像这块,已经取得很不错的成果。目前,在基于深度学习的视频研究这块,有一下几种方式:(1)逐帧处理融合思想:逐帧提取图像特征,然后融合深度特征图。弊端:简单粗暴带来的弊端有:前后帧之间存在大量信息冗余,冗余计算量太大。(2)ConvLSTM这种方法主要依赖于LSTM挖掘每帧之间的时序关系,计算量很大,很难训练,不常用在视频分析中。(3)主流的研究方向基本...原创 2018-12-18 11:33:33 · 9276 阅读 · 0 评论 -
Real-world Anomaly Detection in Surveillance Videos解读与实现
解读:(1)文章思想:此文是在弱监督下训练的,具体而言,就是在一段视频中,只关心是否有异常事件的存在,而不关心具体的异常类型以及异常发生在哪些帧内。基于此,文章的主要实现过程为:首先,使用C3D提取视频特征,文章以32帧为一个bag进行处理。C3D提取视频时空特征是由Facebook团队提出来的。此文章使用公开的C3D预训练模型提取视频特征,然后将提取好的特征拿出来,送到三层全连接层中...原创 2018-12-03 10:51:41 · 9331 阅读 · 77 评论 -
深度学习综述之分类(适合深度学习面试者看)
目前图像方向,主要用深度学习进行分类,定位(回归),检测,那么她三主要区别是什么呢? ①分类:是什么? ②定位:在哪里?是什么?(单目标) ③检测:在哪里?分别是什么?(多目标) 根据不同的任务,我们会选择不同的网络进行训练。首先,分类:①前辈且经久不衰的分类网络:GoogleNet,VGGNet,ResNet(1)GoogleNet 成就:2014年冠军,错误率6.66%。...原创 2018-09-14 15:39:17 · 6954 阅读 · 0 评论 -
Caffe 各层解析
①Data数据层是所有模型的最底层,主要有transform_param{},与data_param{}两中参数设置,data_param{}是数据集来源与训练批大小一些的设置,这个因人而异,根据自己实际情况设置好就行。其中,batch_size是根据训练图像大小,GPU使用情况设置的。transform_param{}是数据预处理的一些设置,一般有:mirror,表示是否开启镜像,crop_s...原创 2018-09-18 16:18:30 · 1292 阅读 · 0 评论 -
ResNet
1网络结构: ResNet将网络往深里设计的思想发挥到了极致,据说有一千多层的,在ResNet网络中,深刻体会到没有最深,只有更深!那么问题来了,Resnet是怎么做到在这么极深的网络下,训练成功的?因为我们知道,随着网络层数的增加,需要训练的网络参数将不断增加,训练强度将大大提升,对于这种上千层的网络,面临的已经不仅仅只有过拟合的问题了,还有Degradation的问题。 从Resnet的原创 2017-08-17 21:29:34 · 713 阅读 · 0 评论 -
VGGNet
1 网络结构: 以224*224输入图片为例: 感觉VGGNet就是加深版的AlexNet,都是卷积与池化的叠加,最后再加两层全连接,然后softmax输出。VGGNet有5段卷积,每段卷积由2~3个卷积层后加一个最大池化组成。卷积核的数量也随着层数的增加而增多。VGGNet也沿用了AlexNet数据增强的方法(Multi-Scale)防止模型过拟合。 相较与AleNet,VGGNet最大原创 2017-08-17 21:13:42 · 5430 阅读 · 0 评论