目标检测算法RCNN论文解读

最新推荐文章于 2025-02-21 17:17:06 发布

纸上得来终觉浅～

最新推荐文章于 2025-02-21 17:17:06 发布

阅读量1.4k

点赞数 7

分类专栏：图像处理 paper阅读文章标签： RCNN

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/qq_32172681/article/details/99105617

版权

论文题目：Rich feature hierarchies for accurate object detection and semantic segmentation

论文地址：https://arxiv.org/abs/1311.2524

tensorflow rcnn代码地址：https://github.com/Liu-Yicheng/R-CNN

RCNN，即Region CNN。

目标检测，不仅要将图片中含有的物体判断出是什么类别，而且还要找到物体所在的位置。

一般分为以下步骤：

1、提取可能存在物体的区域框

2、用CNN提取特征

3、对区域框的物体进行分类、框回归

一、对论文的解读

1、网络模型：AlexNet

2、目标检测过程

（1）用selective search方法，从输入图片中提取2000个类别独立的候选区域。（selective search 也就是将图像分割成很多小的区域，计算区域之间的相似度（颜色、纹理等等），进行融合，形成大一些的region，结合各尺度结果。）

（2）对每个区域使用CNN，得到一个固定长度的特征向量。

（3）对每个区域用SVM进行目标分类。

3、迁移学习、finetune

在ImageNet数据集上训练得到很多很好的物体通用的特征，将其放在PASCAL VOC数据集上训练识别某些物体类型的能力。

4、inputsize：227*227pixel，由CNN的网络输入大小决定，因此将不同尺度的候选框wrap到227*227。

5、NMS

NMS，non maximum suppression，即非极大值抑制。就是将检测出的候选框，按照置信度score进行排序，保留最高的那个候选框。用NMS可以去掉重复的候选框，可以大大提高计算速度，没有冗余计算，而且较为准确。

6、查全率（precison）和查准率（recall）

定义以下标记：

tp：正确的标记为正；预测为真，实际为真

fp：错误的标记为正；预测为假，实际为假

tn：正确的标记为负；预测为真，实际为假

fn：错误的标记为负；预测为假，实际为真

查准率：precision = tp / (tp+fp) ；宁愿漏掉，不可错杀；正确预测占所有预测的比例

查全率：recall = tp / (tp+fn) ；宁可错杀，不可漏掉；正确预测占所有正例的比例

它们是评价模型的不同标准。

7、评价指标mAP

mAP，mean Average precision，对所有类别的precison取平均。

IoU，Intersection over Union，即交并比，本文Iou>0.5，就标记为positive正样本。

最低0.47元/天解锁文章

纸上得来终觉浅～

博客等级

码龄10年

151
原创

603
点赞

3318
收藏

216
粉丝

关注

私信

热门文章

分类专栏

语音识别 52篇
linux 3篇
工作
传统图像处理 13篇
数学 4篇
java 40篇
数据结构与算法 14篇
keras 2篇
ocr 2篇
图像处理 56篇
python 15篇
tensorflow 24篇
深度学习 79篇
机器学习 44篇
pandas 1篇
Kaggle 2篇
paper阅读 21篇
其他 39篇

最新评论

循环神经网络RNN论文解读
轻元素的核聚变: 写的很不错呀，这个真的喜欢了
边缘检测：Canny算子
Midsummer-逐梦: 原图像
基于Kaldi+GStreamer搭建线上的实时语音识别器
m0_75126569: 和你一样
基于Kaldi+GStreamer搭建线上的实时语音识别器
m0_75126569: root@ubuntu:~/kaldi/kaldi-gstreamer-server/test/models# ./download-tedlium-nnet2.sh % Total % Received % Xferd Average Speed Time Time Time Current Dload Upload Total Spent Left Speed 0 0 0 0 0 0 0 0 --:--:-- 0:00:20 --:--:-- 0curl: (7) Failed to connect to phon.ioc.ee port 443: Connection refused gzip: stdin: unexpected end of file tar: Child returned status 1 tar: Error is not recoverable: exiting now
基于Kaldi+GStreamer搭建线上的实时语音识别器
小萌新Z: ot@zpq-virtual-machine:/home/zpq/桌面/kaldi-gstreamer-server/test/models# ./download-tedlium-nnet2.sh % Total % Received % Xferd Average Speed Time Time Time Current Dload Upload Total Spent Left Speed 0 0 0 0 0 0 0 0 --:--:-- 0:00:21 --:--:-- 0 curl: (7) Failed to connect to phon.ioc.ee port 8080 after 21352 ms: 连接被拒绝这是什么问题

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。