前言
计算机视觉领域的八大任务:
- 图像分类
- 目标检测
- 图像语义分割
- 场景文字识别
- 图像生成
- 人体关键点检测
- 视频分类
- 度量学习
本文分享基于深度学习的目标检测算法,以及一些好的开源代码。
目标检测算法
1、R-CNN系列
-
R-CNN
R-CNN 流程图:
要点:- R-CNN 利用 候选区域方法 创建了约 2000 个 ROI(region of interest 感兴趣区域)
-
Fast R-CNN
Fast R-CNN 的流程图:


要点:- Fast R-CNN 把包含特征提取器、分类器和边界框回归器在内的整个网络能通过多任务损失函数进行端到端的训练。
- Fast R-CNN 的训练速度是 R-CNN 的 10 倍,推断速度是后者的 150 倍。
-
Faster R-CNN
Faster R-CNN 的流程图:


要点:- Faster R-CNN 采用与 Fast R-CNN 相同的设计
- 使用候选区域网络(RPN)代替了候选区域方法,RPN效率更高,每幅图像 10 毫秒的速度运行

本文概述了计算机视觉中目标检测的R-CNN系列算法,包括R-CNN、Fast R-CNN和Faster R-CNN,探讨了各自的特点与改进,并提供了开源代码资源链接。




被折叠的 条评论
为什么被折叠?



