
深度学习
gentelyang
呵呵
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
全卷积神经网络FCN
CNN能够对图片进行分类,可是怎么样才能识别图片中特定部分的物体,在2015年之前还是一个世界难题。神经网络大神Jonathan Long发表了《Fully Convolutional Networks for Semantic Segmentation》FCN概述:FCN对图像进行像素级的分类,从而解决了语义级别的图像分割(semantic segmentation)问题。与经典的CNN在卷积层...原创 2018-04-11 15:24:26 · 1483 阅读 · 0 评论 -
RCNN,Fast RCNN, Faster RCNN整理总结
行人检测 概述: 行人检测有两种方向,传统算法和基于深度学习算法。传统算法的典型代表有Haar特征+Adaboost算法,Hog特征+Svm算法,DPM算法。而基于深度学习的行人检测典型代表有RCNN系列,YOLO系列和SSD系列。其中RCNN系列算法是现在使用的最广泛的基于深度学习的行人检测算法。 在说行人检测之前不得不说一下目标检测。行人检测是目标检测下的一个...原创 2018-05-27 17:02:07 · 86595 阅读 · 10 评论 -
R-C3D: Region Convolutional 3D Network for Temporal Activity Detection
1:时序检测(Tmporal Action Detection)时序动作检测这一 方向,Video Analysis相关领域解读之Temporal Action Detection(时序行为检测)是要在视频序列中确定动作发生的时间区间及动作的类别,类似于图像中的目标检测任务,时序检测也可以分为生成时间区间提名及对提名进行分类两个环节。该任务是在视频序列中确定动作发生的时间区间及动作的类别,最常用的...原创 2018-05-28 19:09:02 · 2508 阅读 · 1 评论 -
YOLO学习总结
每个网格要预测B个bounding box,每个bounding box除了要回归自身的位置之外,还要附带预测一个confidence值。 confidence代表了所预测的box中含有object的置信度和这个box预测的有多准两重信息。YOLO的一些细节:1:每个grid有30维,这30维中,8维是回归box的坐标,2维是box的confidence,还有20维是类别。...原创 2018-05-28 21:09:14 · 1953 阅读 · 1 评论 -
YOLO9000学习总结
1:首先将图像划分成7 * 7的网格。2:每个网格要预测B个bounding box,每个bounding box除了要回归自身的位置之外,还要附带预测一个 confidence值。 3:每个网格有30维,这30维中,8维是回归box的坐标,2维是box的confidence,还有20维是类别。confidence代表了所预测的bounding box中含有object的置信度和这个boundin...原创 2018-05-28 21:50:05 · 1266 阅读 · 1 评论 -
YOLO3学习总结
一:背景介绍:YOLO-v3与目前最好的实时监测网络的性能对比OLO作者推出 YOLOv3版,在Titan X上训练时,在mAP相当的情况下,v3的速度比 RetinaNet快3.8倍,同时YOLOv3 可以在22ms之内执行完一张320×320的图片,mAP得分是 51.5,和SSD的准确率相当,但是比它快三倍。YOLOv3非常快速和准确,在IoU=0.5的情况下,与Focal Loss的mAP...原创 2018-07-01 14:32:36 · 21310 阅读 · 1 评论 -
SSD: Single Shot MultiBox Detector学习总结
发表会议:2016 ECCV作者:Wei Liu论文:https://arxiv.org/abs/1512.02325代码:https://github.com/weiliu89/caffe/tree/ssd一:模型结构SSD由VGG-16扩展并添加四个卷积层而成。 ...原创 2018-11-21 17:41:39 · 545 阅读 · 0 评论