既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上大数据知识点,真正体系化!
由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新
4.Faster R-CNN
经过R-CNN和Fast RCNN的积淀,Ross B. Girshick在2016年提出了新的Faster RCNN,在结构上,Faster RCNN已经将特征抽取(feature extraction),proposal提取,bounding box regression(rect refine),classification都整合在了一个网络中,使得综合性能有较大提高,在检测速度方面尤为明显。
论文地址:Faster R-CNN:Towards Real-Time Object Detection with Region Proposal Networks
改进点:
- 集成Region Proposal Network(RPN)网络
- Faster R-CNN = Fast RCNN + RPN
- 取代离线Selective Search模块
- 进一步共享卷积层计算
- 基于Attention注意机制
- Region proposals量少质优(300左右)
Faster RCNN其实可以分为4个主要内容:
- Conv layers。作为一种CNN网络目标检测方法,Faster RCNN首先使用一组基础的conv+relu+pooling层提取image的feature maps。该feature maps被共享用于后续RPN层和全连接层。
- Region Proposal Networks。RPN网络用于生成region proposals。该层通过softmax判断anchors属于positive或者negative,再利用bounding box regression修正anchors获得精确的proposals。
- Roi Pooling。该层收集输入的feature maps和proposals,综合这些信息后提取proposal feature maps,送入后续全连接层判定目标类别。
- Classification。利用proposal feature maps计算proposal的类别,同时再次bounding box regression获得检测框最终的精确位置。
算法整体架构可以阅读:Faster RCNN 实现思路详解
Faster R-CNN性能提升:
部分代码实现:
FasterRCNN.py:
import tensorflow as tf
import numpy as np
from model.rpn import RegionProposalNetwork, Extractor
from model.roi import RoIHead
from utils.anchor import loc2bbox, AnchorTargetCreator, ProposalTargetCreator
def \_smooth\_l1\_loss(pred_loc, gt_loc, in_weight, sigma):
# pred\_loc, gt\_loc, in\_weight
sigma2 = sigma \*\* 2
sigma2 = tf.constant(sigma2, dtype=tf.float32)
diff = in_weight \* (pred_loc - gt_loc)
abs_diff = tf.math.abs(diff)
abs_diff = tf.cast(abs_diff, dtype=tf.float32)
flag = tf.cast(abs_diff.numpy() < (1./sigma2), dtype=tf.float32)
y = (flag \* (sigma2 / 2.) \* (diff \*\* 2) + (1 - flag) \* (abs_diff - 0.5 / sigma2))
return tf.reduce_sum(y)
def \_fast\_rcnn\_loc\_loss(pred_loc, gt_loc, gt_label, sigma):
"""
:param pred\_loc: 1,38,50,36
:param gt\_loc: 17100,4
:param gt\_label: 17100
"""
idx = gt_label > 0
idx = tf.stack([idx, idx, idx, idx], axis=1)
idx = tf.reshape(idx, [-1, 4])
in_weight = tf.cast(idx, dtype=tf.int32)
loc_loss = _s