【深度学习】目标检测神经网络1/2

本文介绍了目标检测神经网络中的模型分类、位置检测技术,重点剖析了RCNN系列(包括Fast-RCNN和Faster-RCNN)的原理与算法流程,以及RegionProposalNetwork(RPN)在目标检测中的应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

目标检测神经网络

概念

模型分类有三种:图像分类即输出图像类别和概率;单目标检测,输出目标的概率和位置;多目标检测,同时输出多个目标的分类、位置、概率。

位置检测分为两种形式:一种是矩形框;另一种是关键点。

交并比,Intersection Over Union,模型推理的矩形框与真值矩形框的重叠度,用于判断结果精度。

非极大值抑制:从同一目标上的多个矩形框筛选最好的一个。

算法流程:

  1. 剔除概率小于阈值的框
  2. 从剩余的框中选择概率最大的
  3. 剔除与前框IOU大于阈值的框,重复步骤2,直到唯一

NMS iteratively removes lower scoring boxes which have an IoU greater than iou_threshold with another (higher scoring) box.

典型方法介绍

从流程上可分为一步、两步检测方法两大类,前者以YOLO系列等模型为代表,后者即RCNN系列,YOLO的主要流程:

  1. 将图像划分GxG个网格
  2. 对每一个网格图像做CNN预测
  3. 对重叠的框运行NMS

本篇主要介绍RCNN系列。

Region-based CNN系列

RCNN系列是典型的两步检测:先找ROI,再对ROI识别。
用颜色、纹理(灰度)直方图判断两个候选区域是否相近。
图像尺度是有限的,所以

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值