计算机视觉——目标检测（R-CNN、Fast R-CNN、Faster R-CNN ）

爱学习的时小糖

已于 2024-03-13 20:27:32 修改

阅读量1.5k

点赞数 19

分类专栏：机器学习文章标签：计算机视觉目标检测 r语言

于 2024-03-11 21:49:16 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/m0_54231818/article/details/136632513

版权

本文介绍了闭集和开集在计算机视觉中的概念，探讨了多模态信息融合技术，并详细解读了目标检测中的R-CNN、FastR-CNN和FasterR-CNN算法，包括它们的原理、步骤和改进。特别关注了候选框生成、ROI池化以及VGG16在FasterR-CNN中的应用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

前言、相关知识

1.闭集和开集

开集：识别训练集不存在的样本类别。
闭集：识别训练集已知的样本类别。

2.多模态信息融合

文本和图像，文本的语义信息映射成词向量，形成词典，嵌入到n维空间。
图片内容信息提取特征，形成n维向量，嵌入到n维空间。
文本和图像的特征距离要尽量近一点，这样文本信息和图像内容信息特征相似。可以根据一种模态输入获得另一模态类型的输出。

3. 计算机视觉任务

分类问题
语义分割
物体检测
示例分割

一、目标检测基础知识

1. 目的：输入彩色RGB图像，输出检测的物体。
2. 过程：分类+定位
3. 最新的目标检测技术：文本 + 图像，制定类别检测
4. 现有方法分类：

1. 一步法（SSD、YOLO）：仅使用一个卷积神经网络CNN直接预测不同目标和位置
2. 两步法（R-CNN、Fast R-CNN、Faster R-CNN）
step1：先生成候选框（利用Region Proposal Network（RPN））
step2：根据候选框分类+精调

二、目标检测——R-CNN(regional with cnn feature)

![R-CNN论文](https://img-blog.csdnimg.cn/direct/587d375e082d4b0aa1605822a0031212.png #pic_center=50%x50%)
R-CNN算法步骤<

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。