1,Yolo
参考:论文解析,论文阅读:You Only Look Once: Unified, Real-Time Object Detection_chenxp2311的博客-优快云博客
CNN详解,CNN(卷积神经网络)详解_nwnlp的博客-优快云博客_cnn网络
其实是一个CNN,包括特征提取三剑客和分类全连接,一阶段指输入为整个图像,输出为定位和分类结果,速度快
泛华能力强,背景错误少,新域,全局
map高
但不适合小目标,且很多个目标集中
定位错误多
注意:CNN包括局部感受野、权值共享和池化这三部分
全连接作用是分类
2、RCNN系列
参考:大话目标检测经典模型(RCNN、Fast RCNN、Faster RCNN), 大话目标检测经典模型(RCNN、Fast RCNN、Faster RCNN) - 雪饼的个人空间 - OSCHINA - 中文开源技术交流社区
faster RCNN包括滑动窗口方式RPN和CNN两个网络,CNN将特征提取,分类和定位一块出来。最后用到NMS算法。
RPN是为定位做准备,将定位的回归问题转化为分类问题,则都可经CNN同一方式一并处理。
RPN是候选框的一种方式,取代了fast RCNN以及之前的选择性搜索生成候选框的方式。
亮点是RPN。
Yolo和RCNN系列比较更简洁,简单把图像划分,把候选框部分去掉。
3,SSD
参考:SSD网络结构,SSD网络原理解析_追逐AI的蜗牛的博客-优快云博客_ssd网络
包括VGG和FPN特征提取、无全连接,Anchor,再分类和定位用到卷积,最后NMS。
亮点是Anchor和FPN。
4、迁移学习适合小量数据
本文深入解析了目标检测领域的几个关键模型:YOLO(You Only Look Once)以其快速而简洁的设计著称,擅长全局检测但对小目标处理不佳;RCNN系列(包括RCNN、FastRCNN和FasterRCNN)通过RPN(Region Proposal Network)改进了候选框生成,提升了检测效率;SSD(Single Shot MultiBox Detector)引入Anchor和FPN(Feature Pyramid Network)实现了一阶段检测,擅长多尺度目标检测。这些模型各有亮点,适应不同的应用场景。

被折叠的 条评论
为什么被折叠?



