目标检测分类和定位:Rethinking Classification and Localization for Object Detection

本文深入探讨了目标检测网络中的fc-head和conv-head结构,发现fc-head对分类任务有利,conv-head有助于定位。论文提出Double-head结构,结合两者优势,通过实验验证了其有效性和精度。网络损失函数结合了fc-head和conv-head的损失,实验表明特定权重分配能优化性能。在推理阶段,采用特定方式融合分类器得分,取得了最佳效果。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

本博客内容来自于论文:https://arxiv.org/pdf/1904.06493.pdf
论文收录于CVPR2020

论文内容

  论文的主要内容是探究了目前目标检测网络中两种主流的Head结构:fully connected head(fc-head)、convolution head(conv-head)。实验证明了使用fc-head更具有空间敏感性,有利于分类任务,而conv-head更加有利于对目标框进行回归的定位任务,作者根据这个结论提出了结合两种形式执行分类和回归任务的Double-head结构,并进行了一系列实验证明了其有效性。
  下图是几种head结构:


在这里插入图片描述

  上图中(a)表示fc-head,FPN经过特征融合后将RoI区域通过全连接层进行分类和box回归;(b)表示conv-head,将RoI区域通过一系列的卷积,最后通过全局均值池化进行分类和box回归;(c)表示作者提出的double-head,提取出来的RoI区域经过全连接层和全卷积层两个分支分别进行分类和回归;(d)是作者在double-head的基础上融合了conv-head部分的分类置信度进行分类决策。

实现细节

  fc-head部分如上图中所示,由两个全连接层组成,参数量13.25M。conv-head部分由下面几个结构组成,其中(a)部分为fc-head结构第一个残差块,用于将提取的RoI的通道数进行升维,参数量1.06M;(b)部分就是fc-head结构后续的残差块参数量1.06M;(c)部分是一个非局部块,加在(b)结构之前,以增强前景目标,参数量2M。作者实验权衡精确度和速度选择由1个(a),2个(b),2个(c)顺序叠加 { a − c − b − c − b } \{a-c-b-c-b\} { acbcb}构成conv-head。


在这里插入图片描述

  网络损失函数如下所示:
L = α f c L f c + α c o n v L c o n v + L r p n L=\alpha^{fc}L^{fc}+\alpha^{conv}L^{conv}+L^{rpn} L=αfcLfc+αconvL

### 关于 EfficientNet 的论文下载 《EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks》是一篇由 Google Research 发表的重要论文,探讨了如何通过复合扩展方法来优化卷积神经网络 (ConvNets) 的性能。该论文提出了一种新的模型缩放策略——复合扩展(Compound Scaling),这种方法能够更高效地平衡宽度、深度分辨率之间的关系,从而显著提高模型的精度效率[^1]。 如果需要获取这篇论文的 PDF 文件,可以通过以下几种方式: #### 1. **官方发布平台** 论文最初发表在 arXiv 上,因此可以直接访问其官方网站进行下载: - 链接地址:https://arxiv.org/abs/1905.11946 (此链接指向原始版本的预印本) #### 2. **学术搜索引擎** 使用学术搜索引擎可以帮助快速定位到论文资源。常用的工具包括但不限于: - Google Scholar: https://scholar.google.com/ 输入关键词 “EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks”,即可找到相关条目并尝试点击免费或付费选项下载。 #### 3. **第三方存储库** 如果无法直接从上述渠道获取,还可以考虑一些开放存取网站,例如: - Papers With Code: 提供大量机器学习领域经典论文及其对应代码实现。 地址:https://paperswithcode.com/paper/efficientnet-rethinking-model-scaling-for - Semantic Scholar: 类似于Google Scholar的功能,但界面更加简洁友好。 地址:https://www.semanticscholar.org/ 以下是基于 Python 编写的简易脚本来模拟自动抓取功能(仅作演示用途,请勿滥用爬虫技术违反版权规定): ```python import requests def fetch_paper(url, filename="paper.pdf"): response = requests.get(url) if response.status_code == 200: with open(filename, 'wb') as f: f.write(response.content) print(f"Paper successfully downloaded as {filename}") else: print("Failed to retrieve the paper") # Example usage fetch_paper('https://arxiv.org/pdf/1905.11946', 'EfficientNet_paper.pdf') ```
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值