基于改进faster-rcnn的舰船目标检测与识别(阅读笔记)

该博客介绍了基于faster-rcnn的舰船目标检测模型的改进,主要创新在于rpn网络中应用了K-means聚类算法,优化了候选框的大小。faster-rcnn的特点包括区域建议网络、ROI池化、分类和非极大值抑制。文章详细阐述了K-means聚类方法及其在模型中的应用,以及具体实现流程和实验分析,包括数据集制作、边框尺寸选取、训练模型等环节。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、模型创新点
模型改进:rpn网络部分加入了K-means聚类算法,对框的大小聚类,并输入rpn网络

二、faster-rcnn特点
1.1区域建议网络
1、传统的区域建议框选择
方法:selective search
局限性:产生的建议框有相互叠加的,增加了计算量

2、faste-rcnn
方法:rpn(region proposal network)
原理:卷积后提取的特征图与原图位置相对应,将feature maps作为rpn网络的输入,并在每一张特征图每个元素上产生9个大小不同的anchors box,
模型特点:共有两个卷积网络
(1)一个是11卷积核18维的卷积运算,判断该anchors
box是否是前景图像
(2)一个是1
1卷积核36维运算,得到该anchor相对于
原图的ground truth的相对坐标

1.2感兴趣区域池化(roi pooling)
将候选区域映射到特征图上,将每一块按照水平和垂直分为7份,将每个块按照最大池化法处理,输出7x7的大小,实现固定大小输出。

1.3分类
分类部分得到的特征向量,经过全连接和softmax进行计 算 和 分 类,看每一个区域属于哪一个种类,并且输出属于这个种类的概率为 多 少.然后再次通过边框回归,得 到 这 个 区 域 与 真 实的 GT位置的偏移量,用于之后的回归,使得目标检测框更加接近真实位置.

1.4非极大值抑制
作用:在经过分类后,每个类别的周围会有多个候选框出现,他们之间有一定的重合,所以通过该方法解决这个问题
在这里插入图片描述

步骤:1、将所有框的得分排序,选出得分最高的框
2、对剩下的框进行遍历,同时设定一个阙值,其他的框和
这个得分最高的框的iou值大于这个阙值,则删除
3、再从剩余的框里重复1和2
三、文章创新点

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值