
目标检测
文章平均质量分 86
小灰狼@花花
这个作者很懒,什么都没留下…
展开
-
目标检测:从overfeat到Fast R-CNN
以下内容摘自斯坦福cs231n目标检测课程:计算机视觉任务:ImageNet 分类和定位任务:Idea #1:定位问题视为回归问题实现步骤:1. 训练(或下载)一个分类模型(AlexNet, VGG, Inception)2. 添加新的全连接层用作“回归”3. 仅训练“回归”模块,SGD,L2 Loss4. 测试时加入“分类”和“回归”回归分为两种:独立于类别的回归:Class agnostic (4 numbers / per box原创 2020-06-09 16:12:00 · 634 阅读 · 0 评论 -
Faster R-CNN 基本原理及网络模型
Faster R-CNNFaster R-CNN主要贡献是提出RPN网络,用于替代Selective Search或其他的图像处理分割算法,实现端到端的训练(end-to-end)。1.卷积层后插入RPNRPN经过训练后直接产生Region Proposal,无需单独产生Region Proposal。2. RPN后接ROI Pooling和分类层、回归层,同Fast R-CNN。候选区域(anchor)特征图可以看做一个尺度51*39的256通道图像,对于该图像的每..原创 2020-06-09 15:31:20 · 2495 阅读 · 0 评论 -
SSD: The Single Shot Detector
比YOLO: You Only Look Once 还要快,还要精确。保证速度的同时,其结果的 mAP 可与使用 region proposals 技术的方法(如 Faster R-CNN)相媲美。 为了得到高精度的检测结果,在不同层次的 feature maps 上去 predict object、box offsets,同时,还得到不同 aspect ratio 的 predictions。...原创 2020-01-08 10:39:59 · 337 阅读 · 0 评论 -
R-FCN: Object Detection via Region-based Fully Convolutional Networks
整个R-FCN的结构一个base的conv网络如ResNet101, 一个RPN(Faster RCNN来的),一个position sensitive的prediction层,最后的ROI pooling+投票的决策层。R-FCN的idea出发点(关键思想)分类需要特征具有平移不变性,检测则要求对目标的平移做出准确响应。现在的大部分CNN在分类上可以做的很好,但用在检测上效果不佳...原创 2020-01-03 14:27:58 · 362 阅读 · 0 评论 -
RetinaNet 理论与代码详解
RetinaNet 是来自Facebook AI Research 团队2018年的新作,在当前的目标检测领域是最强的网络(速度/精度/复杂度)。下面两张是基于COCO 本地测试集的实验数据:主要贡献:在One stage中,detector直接在类别不平衡(负样本很多,正样本很少)中进行分类和回归,直接输出bbox和类别,原有的交叉熵损失无法处理这种不平衡,导致训练不充...原创 2020-01-02 14:20:42 · 4739 阅读 · 14 评论 -
FPN 特征金字塔网络
FPN(feature pyramid networks)特征金字塔是多尺度目标检测系统中的一个基本组成部分。近年来深度学习目标检测却有意回避这一技巧,部分原因是特征金字塔在计算量和用时上很敏感(一句话,太慢)。这篇文章,作者利用了深度卷积神经网络固有的多尺度、多层级的金字塔结构去构建特征金字塔网络。使用一种自上而下的侧边连接,在所有尺度构建了高级语义特征图,这种结构就叫特征金字塔网络(FPN...原创 2019-12-16 17:50:16 · 1354 阅读 · 0 评论 -
YOLO V3 源码分析
在输入320×320的图片后,YOLOv3能在22毫秒内完成处理,并取得28.2mAP的成绩。它的精度和SSD相当,但速度要快上3倍。和旧版数据相比,v3版进步明显。在Titan X环境下,YOLOv3的检测精度为57.9AP5057.9AP50,用时51ms;而RetinaNet的精度只有57.5AP5057.5AP50,但却需要198ms,相当于YOLOv3的3.8倍。以下原文翻译:...原创 2019-12-16 12:03:51 · 567 阅读 · 0 评论 -
YOLO V2
YOLOv2是YOLOv1的改进,在保证速度的同时mAP更高,并保持着自己作为one-stage方法的优势(1)Batch NormalizationBatch Normalization可以提升模型收敛速度,而且可以起到一定正则化效果,降低模型的过拟合。在YOLOv2中,每个卷积层后面都添加了Batch Normalization层,并且不再使用droput。使用Batch Normal...原创 2019-11-08 16:02:52 · 268 阅读 · 0 评论 -
YOLO模型详解
YOLO将物体检测作为一个回归问题进行求解,输入图像经过一次inference,便能得到图像中所有物体的位置和其所属类别及相应的置信概率。而rcnn/fast rcnn/faster rcnn将检测结果分为两部分求解:物体类别(分类问题),物体位置即bounding box(回归问题)。YOLO检测网络包括24个卷积层和2个全连接层,如下图所示。(YOLO网络借鉴了GoogLeNet分类网络结...原创 2019-11-07 14:02:37 · 4779 阅读 · 0 评论