
论文阅读
文章平均质量分 76
记录一下
oyou-2021
这个作者很懒,什么都没留下…
展开
-
ResNet解读和1×1卷积介绍
深度卷积网络好在哪里?-----它可以加很多层,把网络变得很深,不同程度的层可以得到不同等级的特征。 作者提出一个问题--一个网络只是简单的堆叠就好了嘛?——不是,当网络变得很深的时候,梯度会出现爆炸或者消失。一个解决方法,初始化时设置一个合适的权重,不要太大也不要太小。又或者在中间加入normalization(包括BN),可以使得校验每个层之间的那些输出和它梯度的那些均值和方差。上述两个方法可以让网络收敛,但是网络变深后,性能会变差(不是过拟合造成的,因为训练误差和测试误差都会变得很差),所以现在网络虽原创 2022-07-20 20:58:00 · 3771 阅读 · 0 评论 -
Beyond Max-Margin: Class Margin Equilibrium for Few-shot Object Detection论文阅读
新的类别分类和表示之间的隐含矛盾被忽略了,这个矛盾是——为了将类彼此分开,两个基类中的任何一个基类都需要彼此相距较远(max-margin)),这聚合了新类的类内距离。为了准确地表示新类,基类的分布应该接近新类的分布(min-margin),这提高了分类的难度。如下图即如何在分类和表示中取得平衡,是一个问题。 因此作者提出CME,优化特征空间划分和novel类表示。对于训练和微调阶段所用的数据集dataset D都被分为支持集和询问集,具体如下图:该个网络结构由两个分支组成,即支持集分支和询问集分支。支持集原创 2022-07-06 22:26:16 · 1158 阅读 · 0 评论 -
Dynamic Sparse R-CNN
是对Sparse R-CNN的改进Sparse R-CNN是近期通过对稀疏,可学习提议框和提议特征进行集合预测的一种强大的目标检测方法。在该篇文章中,提出了两种动态设计(DLA和DPG)来改进Sparse R-CNN。为什么:作者认为在Sparse R-CNN中基于匈牙利算法的一对一匹配不是最优的,所以提出一个多对一分配的假设来更有效地优化proposals并促进检测器训练。实现:遵循基于 CNN 的方法 , 并在 Transformer 中应用最优传输分配(OTA)。OTA 是一种探索检测框应如何与基本事原创 2022-06-01 16:35:27 · 786 阅读 · 0 评论 -
Generalized Focal Loss
论文笔记原创 2022-05-15 23:44:50 · 149 阅读 · 0 评论 -
Focal loss
generalized focal loss论文笔记见为什么提出focal foss是因为先验框,对于一阶段目标检测器,存在非常多的先验框,因为它会将输入的图片划分为不同大小的网格,然后网格里包括很多先验框。比如SSD,包含了8732个先验框,但是只有五六个先验框真实包含目标,即正样本,所以导致了正负样本非常不平衡,SSD采取的方法控制正负样本的比例,使为1:3,有一定效果,但有待改进。Focal loss提出利用权重来控制正负样本。什么是Focal lossFocal loss是何恺明大神原创 2022-05-15 23:47:51 · 427 阅读 · 0 评论 -
Object Detection in 20 Years: A Survey
Zhengxia Zou, Zhenwei Shi, Member, IEEE, Yuhong Guo, and Jieping Ye, Senior Member, IEEE论文获取:https://arxiv.org/abs/1905.05055v2摘要:目标检测作为计算机视觉中最基本、最具挑战性的问题之一,近年来受到了广泛的关注。它在过去二十年的发展可以说是计算机视觉历史的缩影。如果我们把今天的物体检测看作是深度学习力量下的一种技术美学,那么让时光倒流20年,我们将见证冷兵器时代的智慧。本文从转载 2022-05-05 00:02:26 · 839 阅读 · 0 评论 -
End-to-End Object Detection with Fully Convolution Network
会议:CVPR 2021论文:https://arxiv.org/pdf/2012.03544.pdf代码:GitHub - Megvii-BaseDetection/DeFCN: End-to-End Object Detection with Fully Convolutional Network干什么怎么干结论创新点原创 2022-04-26 22:42:30 · 659 阅读 · 0 评论 -
MLCVNet: Multi-Level Context VoteNet for 3D Object Detection
对于输入的3D点云,像2D一样使用一个bounding box去将相应的物体包围起来,不过这里使用的bounding box也同样变成了3维的。研究了什么是对三维目标的检测,准确来说,是加入了对上下文环境后对三维目标的检测。这样提高了检测的准确性。研究方法是什么应该是VoteNet的改进。以VoteNet为基本方法,加入了三个子模块,分别为PPC,OOC,GSC模块。过程是什么整体结构分为了:特征提取模块、上下文模块、抑制模块(和...原创 2022-04-16 22:12:12 · 474 阅读 · 0 评论 -
ImageNet Classification with Deep Convolutional Neural Networks经典论文
来自B站视频【论文复现代码数据集见置顶评论】3小时高效复现CV计算机视觉经典论文!论文精讲&代码复现:目标检测、图像分类、图像分割、轻量化网络、GAN、OCR_哔哩哔哩_bilibili博客-ImageNet Classification with Deep Convolutional Neural Networks论文解读 - 知乎1、研究背景 AlexNet成功的两个因素,第一个是数据集,第二个是强大的计算资源。AlexNet的研究意义一...原创 2022-04-13 21:16:24 · 2926 阅读 · 0 评论 -
You Only Look One-level Feature
研究了什么根据作者介绍FPN有两个优点-,一是多尺度融合(融合多个低分辨率和高分辨率的输入,获取更好的表示),二是分而治之(根据对象的尺度检测不同级别的对象)。 然后作者就研究这两个优点哪一个对一阶段检测器的贡献程度更大。研究方法是什么研究过程是什么结论是什么...原创 2022-04-16 11:08:00 · 2893 阅读 · 0 评论