图像分析学习笔记(5):智能目标检测与识别

目标检测与识别的概念

  • 计算机视觉的四大基础任务:图像分类、目标定位、目标检测、语义分割
    在这里插入图片描述
  • 图片分类:
    通过算法对其中的对象进行分类。
  • 目标检测:
    在图像中找到特定类别的位置,并用边框把目标圈起来。
    目标检测=定位+分类
    • 传统目标检测流程:区域选择-特征提取-分类器分类
    • 目标检测的挑战:目标在尺度、光照、姿态、遮挡方面差异很大

目标检测与识别的评价指标

  • 目标检测算法的输出:类别置信度、边界框(预测框)
  • 度量:交并比、正确类别置信度,两个框的交集比上两个框的并集
  • 精准率和召回率
  • Average Precision:不同Recall下的Precision平均
  • mAP:不同类别的AP平均

基于深度学习的目标检测与识别

  • 数据
    • 准备训练数据:图像和标签 jpg和xml
  • 结构
    • 非极大值抑制:选择最大置信度的box,剔除与该box iou过大的box
    • 两阶段目标检测:候选区域生成、分类
      • R-CNN:区域推荐、CNN分类
      • Fast R-CNN:roipooling(依次前向传播得到所有候选区域)、多任务损失函数(分类和回归同时考虑)
      • Faster R-CNN:使用区域推荐网络替代选择性的搜索=RPN+Fast R-CNN
    • 单阶段目标检测:
      • YOLO:YOU ONLY LOOK ONCE.不足:定位精度差、漏检高
      • SSD:SINGLE SHOT MULTIBOX DETECTOR,加入特征金字塔
      • YOLOV2:anchor策略
      • YOLOV3:使用Darknet-53网络、多尺度预测
      • YOLOV~ 在这里插入图片描述
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值