2024年大数据最全【深度学习】（四）目标检测—(1)，2024年最新我就不信你还听不明白了

最新推荐文章于 2025-04-09 08:00:00 发布

2401_84615919

最新推荐文章于 2025-04-09 08:00:00 发布

阅读量1.2k

点赞数 25

分类专栏：程序员文章标签：大数据深度学习目标检测

本文链接：https://blog.youkuaiyun.com/2401_84615919/article/details/138459134

版权

本文详细介绍了Faster R-CNN在目标检测领域的应用，它整合了特征抽取、提案提取、边界框回归和分类，显著提高了检测速度。Faster R-CNN通过集成Region Proposal Network（RPN）和共享卷积层计算，替代了离线Selective Search模块，减少了提案数量并提高了质量。文章内容包括Faster RCNN的四个主要部分：卷积层、RPN网络、RoI池化和分类，并提供了相关代码实现。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上大数据知识点，真正体系化！

由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新

需要这份系统化资料的朋友，可以戳这里获取

4.Faster R-CNN

经过R-CNN和Fast RCNN的积淀，Ross B. Girshick在2016年提出了新的Faster RCNN，在结构上，Faster RCNN已经将特征抽取(feature extraction)，proposal提取，bounding box regression(rect refine)，classification都整合在了一个网络中，使得综合性能有较大提高，在检测速度方面尤为明显。
论文地址：Faster R-CNN:Towards Real-Time Object Detection with Region Proposal Networks
改进点：

集成Region Proposal Network（RPN）网络
Faster R-CNN = Fast RCNN + RPN
取代离线Selective Search模块
进一步共享卷积层计算
基于Attention注意机制
Region proposals量少质优（300左右）

Faster RCNN其实可以分为4个主要内容：

Conv layers。作为一种CNN网络目标检测方法，Faster RCNN首先使用一组基础的conv+relu+pooling层提取image的feature maps。该feature maps被共享用于后续RPN层和全连接层。
Region Proposal Networks。RPN网络用于生成region proposals。该层通过softmax判断anchors属于positive或者negative，再利用bounding box regression修正anchors获得精确的proposals。
Roi Pooling。该层收集输入的feature maps和proposals，综合这些信息后提取proposal feature maps，送入后续全连接层判定目标类别。
Classification。利用proposal feature maps计算proposal的类别，同时再次bounding box regression获得检测框最终的精确位置。

算法整体架构可以阅读：Faster RCNN 实现思路详解

Faster R-CNN性能提升：
在这里插入图片描述
部分代码实现：

FasterRCNN.py:

import tensorflow as tf
import numpy as np
from model.rpn import RegionProposalNetwork, Extractor
from model.roi import RoIHead
from utils.anchor import loc2bbox, AnchorTargetCreator, ProposalTargetCreator


def \_smooth\_l1\_loss(pred_loc, gt_loc, in_weight, sigma):
    # pred\_loc, gt\_loc, in\_weight
    sigma2 = sigma \*\* 2
    sigma2 = tf.constant(sigma2, dtype=tf.float32)
    diff = in_weight \* (pred_loc - gt_loc)
    abs_diff = tf.math.abs(diff)
    abs_diff = tf.cast(abs_diff, dtype=tf.float32)
    flag = tf.cast(abs_diff.numpy() < (1./sigma2), dtype=tf.float32)
    y = (flag \* (sigma2 / 2.) \* (diff \*\* 2) + (1 - flag) \* (abs_diff - 0.5 / sigma2))
    return tf.reduce_sum(y)


def \_fast\_rcnn\_loc\_loss(pred_loc, gt_loc, gt_label, sigma):
    """
 :param pred\_loc: 1,38,50,36
 :param gt\_loc: 17100,4
 :param gt\_label: 17100
 """
    idx = gt_label > 0
    idx = tf.stack([idx, idx, idx, idx], axis=1)
    idx = tf.reshape(idx, [-1, 4])
    in_weight = tf.cast(idx, dtype=tf.int32)
    loc_loss = _s

最低0.47元/天解锁文章