
深度学习基础
文章平均质量分 76
零基础讲解深度学习,初学者能够以第一人称角度切入,本栏将介绍最流行的卷积神经网络,从神经网络起源到目标检测的RCNN、SSD、YOLO等主流框架。
linolzhang
资深产品经理,系统架构师,PMP,PMI-ACP敏捷开发专家,个人主要研究领域为 AI、AR、3D Visualization。
展开
-
人群密度估计-Crowd Density
一. 应用背景 在安防大背景下,对敏感区域人流量的管控是一个重要的课题,防止人群骚乱、踩踏现象的发生,对非预期的人员汇聚进行预警等等,最常用的方法是检测到每个目标,然后借助 Perspective 矩阵完成到实际位置的映射,当然,在目标很难检测的情况下(密度极大、遮挡严重),基于回归的方法就派上了用场。 本节主要讲基于深度学习的回归方法来实现人群密度检测。二. 人群密度之 Cr原创 2017-12-18 23:47:49 · 18345 阅读 · 7 评论 -
视频人员行为识别(Action Recognition)
一. 提出背景 目标:给定一段视频,通过分析,得到里面人员的动作行为。 问题:可以定义为一个分类问题,通过对预定的样本进行分类训练,解决一个输入视频的多分类问题。 这里提出的问题是简单的图片(视频)分类问题,该问题的前提条件是:场景目标为单人,并且占据图片比较大的比例,如下图所示: 还有一类问题是基于行人检测,去估计行人的姿态和动作,原创 2017-09-19 21:28:28 · 17996 阅读 · 7 评论 -
NoScope:极速视频目标检测
一.提出背景 在基于CNN的方法提升到一个很高的准确度之后,效率又成为人们所关注的话题,目前兼备准确度和效率的方法包括 SSD、YOLO v2,其检测效率通常能到达 30-100FPS,而这里面的代价就是上万块的显卡,这个代价是相当高的。当下视频获取设备(CCTV摄像头)成本通常是几百块,而采用上述分类算法,其成本可能是几千,这就是视频获取和视频分析之间的巨大鸿沟。 基于此原创 2017-08-29 23:22:04 · 9996 阅读 · 1 评论 -
DenseNet:更接近于真实神经网络的跨层连接
一. 提出背景 论文:Densely Connected Convolutional Networks 【点击下载】 Caffe代码:【Github】 受 Highway、ResNet 等算法思路的启发,提出一种跨层的连接网络,思路非常简单,直接上图: 二. 算法思路 作者这个提法比较大胆,每个层的 input 包括之前所有层的信息,通原创 2017-08-16 22:11:08 · 10271 阅读 · 2 评论 -
特征金字塔网络 FPN
一. 提出背景 论文:Feature Pyramid Networks for Object Detection 【点击下载】 在传统的图像处理方法中,金字塔是比较常用的一种手段,像 SIFT 基于金字塔做了多层的特征采集,对于深度网络来讲,其原生的卷积网络特征决定了天然的金字塔结构。深度网络在目标检测领域的应用 比如早期的 Fast RCNN,Faster RCNN 都原创 2017-07-21 22:18:10 · 10286 阅读 · 1 评论 -
Faster R-CNN改进篇(二): RFCN ● RON
@改进1:RFCN 论文:R-FCN: Object Detection via Region-based Fully Convolutional Networks 【点击下载】 MXNet代码:【Github】一. 背景介绍 RCNN 在目标检测上取得了很大的成功,比如 SPPnet、Fast R-CNN、Faster R-CNN 等,这些方法的典型特征原创 2017-07-15 01:15:40 · 18865 阅读 · 3 评论 -
Faster R-CNN改进篇(一): ION ● HyperNet ● MS CNN
一. 源起于Faster 深度学习于目标检测的里程碑成果,来自于这篇论文: Ren, Shaoqing, et al. “Faster R-CNN: Towards real-time object detection with region proposal networks.” Advances in Neural Information Processing Syst原创 2017-07-02 23:31:36 · 17263 阅读 · 7 评论 -
目标跟踪之ECO:Efficient Convolution Operators for Tracking
一. 相关滤波算法总结 作者首先分析了影响 相关滤波算法 效率的几个原因:1)Model Size (模型大小) 包括两个方面: - 模型层数,对应多分辨率 Sample,比如多层 CNN - 特征维度,对应庞大的 HOG or CNN特征图 这里的效率影响是显而易见的,层数或特征越多,表现力越丰富,计算量也原创 2017-05-31 23:13:23 · 15085 阅读 · 4 评论 -
目标跟踪之相关滤波:CF及后续改进篇
一. 何为相关滤波? Correlation Filter 最早应用于信号处理,用来描述两个信号之间的相关性,或者说相似性(有点像早期的概率密度),先来看定义: 对于两个数据 f 和 g,则两个信号的相关性(correlation)为: 其中 f∗ 表示 f 的 复共轭,这是和卷积的区别。原创 2017-05-25 23:40:58 · 22278 阅读 · 2 评论 -
目标跟踪之GOTURN:Learning to Track at 100 FPS with Deep Regression Networks
一. 简介 选择这篇文章的原因在于能实现 100帧的效果,对于跟踪来讲,大多数应用场景需要实时跟踪,应该说仅仅实时跟踪还不够,还需要计算资源来做 视频解码、检测、比对 等多个工作。 这篇文章 2016年来自 Stanford 大学的 David Held,通过 CNN直接回归的方式得到目标位置。 论文下载:Learning to Track原创 2017-05-16 23:29:30 · 8657 阅读 · 2 评论 -
深度学习之目标跟踪
一. 跟踪进展(Advances in Visual Tracking) 作者在前面的机器学习文章中也讲到了 Tracking,感兴趣的童鞋可以 Review一下:机器学习实践系列之5 - 目标跟踪 前面只是基于传统方法的跟踪,这一篇我们 Focus 在深度学习上。 关注跟踪算法的进展,只需要 Follow VOT Challenge 就可以了,Vi原创 2017-05-15 23:13:13 · 13086 阅读 · 1 评论 -
Mask-RCNN技术解析
一. Mask-RCNN 介绍 上篇文章介绍了 FCN,这篇文章引入个新的概念 Mask-RCNN,看着比较好理解哈,就是在 RCNN 的基础上添加 Mask。 Mask-RCNN 来自于年轻有为的 Kaiming 大神,通过在 Faster-RCNN 的基础上添加一个分支网络,在实现目标检测的同时,把目标像素分割出来。 论文下载:Mask R-CN原创 2017-05-12 23:01:29 · 122986 阅读 · 24 评论 -
图像分割与FCN
一. 图像语义分割 传统的图像分割方法主要包括以下几种:1)基于边缘检测2)基于阈值分割 比如直方图,颜色,灰度等3)水平集方法 这里我们要说的是语义分割,什么是语义分割呢?先来看张图: 将目标按照其分类进行像素级的区分,比如区分上图的 摩托车 和 骑手,这就是语义分割,语义分割赋予了场景理原创 2017-05-11 21:55:24 · 27010 阅读 · 0 评论 -
ResNeXt网络进化
一. ResNeXt 的 Block 改进 MSRA 的 KaiMing 转战Facebook的又一力作,大牛的神来之笔:论文下载:Aggregated Residual Transformations for Deep Neural Networks代码地址:【Github】 ResNet、Inception 已经成为目前网络的前进方向,堆叠的Bl原创 2017-05-11 00:01:51 · 8350 阅读 · 6 评论 -
ResNet残差网络
前面我们对常用的经典网络进行了介绍,可以查看前面文章:浅入浅出TensorFlow 6 - 实现经典网络 随着网络越来越深,大家发现,仅仅靠 BN、ReLU、DropOut 等 Trick无法解决收敛问题,相反,网络的加深带来参数的增加。 基于之前的实践经验,我们知道:网络并不是越深越好,一方面过多的参数容易导致过拟合(当然样本足够多可以一定程度上解决这个问题);另原创 2017-05-08 00:25:27 · 12775 阅读 · 0 评论 -
基于深度学习的Person Re-ID(度量学习)
度量学习 是指 距离度量学习,Distance Metric Learning,简称为 DML,做过人脸识别的童鞋想必对这个概念不陌生,度量学习是Eric Xing在NIPS 2002提出。 这并不是个新词,说的直白一点,metric learning 是通过特征变换得到特征子空间,通过使用度量学习,让类似的目标距离更近(PULL),不同的目标距离更远(push),也就是说,度量学原创 2017-05-06 00:38:55 · 8183 阅读 · 0 评论 -
基于深度学习的Person Re-ID(特征提取)
一. CNN特征提取 通过上一篇文章的学习,我们已经知道,我们训练的目的在于寻找一种特征映射方法,使得映射后的特征 “类内距离最小,类间距离最大”,这种特征映射 可以看作是 空间投影,选择一组基,得到基于这组基的特征变换,与 PCA 有点像。 这一篇我们讲的就是基于 CNN的特征提取,特征提取过程也就是训练过程,训练结果就是 CNN 的参数。 以 T原创 2017-05-01 23:44:03 · 10325 阅读 · 0 评论 -
基于深度学习的Person Re-ID(综述)
一. 问题的提出 Person Re-ID 全称是 Person Re-Identification,又称为 行人重检测 or 行人再识别,直观上可以通过两种思路进行比对,一种是 通过 静态图像(still-image)进行特征比对,另一种是通过视频的时序特征(temporal)进行 Video Re-Id。 不管是采用 图像特征比对的方法 还是 结合时序特征比原创 2017-05-01 22:09:17 · 22606 阅读 · 1 评论 -
深度学习之对抗网络
一. 对抗网络的由来 对抗网络 是个新词,全名叫 生成式对抗网络(Generative adversarial nets),就像深度学习一样,发明时间并不长。 Ian Goodfellow(生成对抗性网络的发明者)定义了 对抗网络; Yann LeCun(三巨头之一)在Quora上直播时表示生成对抗性网络近期人工智能最值得期待的算法之一;原创 2017-03-02 22:37:35 · 14229 阅读 · 1 评论 -
深度学习流行网络与数据集
一. 常用网络 深度学习相关的几个比较著名的网络,AlexNet、VGG、GoogleNet、ResNet。模型 AlexNet VGG GoogleNet ResNet 时间 2012 2014原创 2017-03-02 22:35:25 · 2509 阅读 · 0 评论 -
深度学习算法之YOLOv2
一. 久违的新版本 YOLO 问世已久,不过风头被SSD盖过不少,原作者自然不甘心,YOLO v2 的提出给我们带来了什么呢? 先看一下其在 v1的基础上做了哪些改进,直接引用作者的实验结果了: 条目不少,除了 Anchor Boxes没有用,其他的该加的都加上了。我们一个一个来看: A)Batch NormB)Hi原创 2017-03-02 22:32:36 · 21011 阅读 · 9 评论 -
深度学习基础之 - 行人检测SSD
Faster-RCNN 虽然在效果上做到了 State-Of-The-Art,但效率问题无法做到实时,YOLO 在此基础上提出了改进:一. Region Proposal Region Proposal 过程的优点是能够初步检测有效的 Candidate,缺点是带来效率的降低(Faster构造了两级网络)。 YOLO去掉了 Faster的 RPN ...原创 2017-02-16 22:39:58 · 18844 阅读 · 4 评论 -
目标检测-RCNN系列
• RCNN RCNN(Regions with CNN features)是将CNN方法应用到目标检测问题上的一个里程碑,由年轻有为的RBG大神提出,借助CNN良好的特征提取和分类性能,通过RegionProposal方法实现目标检测问题的转化。 算法可以分为四步: 1)候选区域选择 Region Proposal是一类传统的区域提取方原创 2017-01-11 16:26:12 · 72851 阅读 · 12 评论 -
深度学习基础
AI技术研究的兴起,伴随着两种最直观的思维技巧,即遗传算法与神经网络,这是对生物学研究最直观的技术抽象。深度学习的前身就是神经网络,这个80年代灵光乍现的技术,在那一波人工智能的大潮驱使下,带着人们对于未来AI时代的憧憬,迅速蔓延,一时风头无两,和今天深度学习的火热几乎如出一辙。 某乎友的观点给出了这两种技术的鲜明对比,如同麻汁与芝麻酱,换汤不换药,所谓深度在于把二两变成了三斤,原创 2017-01-11 14:45:18 · 4480 阅读 · 0 评论 -
CNN基础
卷积神经网络(ConvolutionalNeural Networks,简称CNN)提出于20世纪60年代,由Hubel和Wiesel在研究猫脑皮层中用于局部敏感和方向选择的神经元时发现。 CNN是目前深度学习最大的一个流派,其应用优点在于避免了对图像的复杂前期预处理,可以直接处理原始图像。CNN核心在于“卷积”,传统机器学习中LBP、HOG等特征都可以看作是卷积的一种特殊形式,原创 2017-01-11 14:21:07 · 3024 阅读 · 0 评论