
深度学习-论文笔记
文章平均质量分 91
深度学习-论文笔记
浩瀚之水_csdn
路漫漫其修远兮,吾将上下而求索,立刻行动,坚持,努立
展开
-
深度学习-学习知识汇总
翻译:[] [] 翻译:[] [] 翻译:[] [] 翻译:[] [] 翻译:[] [] 翻译:[] [原创 2024-10-20 18:16:59 · 257 阅读 · 0 评论 -
温故知新之YOLOV10论文翻译
在过去几年中,YOLOs 因其在计算成本和检测性能之间的有效平衡而成为实时目标检测领域的主流模式。研究人员对 YOLOs 的架构设计、优化目标、数据增强策略等进行了探索,并取得了显著进展。然而,后处理对非最大抑制(NMS)的依赖阻碍了 YOLO 的端到端部署,并对推理延迟产生了不利影响。此外,YOLOs 中各种组件的设计缺乏全面彻底的检查,导致明显的计算冗余,限制了模型的能力。这使得效率不尽如人意,性能还有很大的提升空间。翻译 2024-10-20 17:37:15 · 243 阅读 · 0 评论 -
温故知新之YOLOV9论文翻译
当今的深度学习方法关注于如何设计最合适的目标函数,以使模型的预测结果最接近真实情况。同时,还必须设计一种合适的架构,以便为预测提供足够的信息。现有方法忽视了一个事实,即当输入数据经过逐层特征提取和空间变换时,会丢失大量信息。本文将深入探讨数据在通过深度网络传输时的重要问题,即信息瓶颈和可逆函数。我们提出了可编程梯度信息(PGI)的概念,以应对深度网络所需的各种变化,以实现多个目标。PGI可以为目标任务提供完整的输入信息,以计算目标函数,从而可以获得可靠的梯度信息来更新网络权重。翻译 2024-10-20 17:16:54 · 114 阅读 · 0 评论 -
温故知新之YOLOV7论文翻译
YOLOv7在5FPS到 160 FPS 范围内的速度和准确度都超过了所有已知的物体检测器,YOLOv7 在 5 FPS 到 160 FPS 范围内的速度和准确度都超过了所有已知的目标检测器,并且在 GPU V100 上 30 FPS 或更高的所有已知实时目标检测器中具有最高的准确度 56.8% AP。翻译 2024-10-20 16:59:08 · 132 阅读 · 0 评论 -
温故知新之YOLOV6论文翻译
多年来,YOLO系列实际上已成为高效目标检测的行业标准。YOLO社区蓬勃发展,丰富了它在众多硬件平台和丰富场景中的使用。在这份技术报告中,我们努力将其极限推向一个新的水平,以坚定不移的心态为行业应用向前迈进。考虑到现实环境中对速度和准确性的不同要求,我们广泛研究了来自工业界或学术界的最新目标检测进展。具体来说,我们大量吸收了最近网络设计、训练策略、测试技术、量化和优化方法的思想。在此基础上,我们集成了我们的思想和实践来构建一套部署准备好各种规模的网络,以适应不同的用例。翻译 2024-10-20 16:18:54 · 126 阅读 · 0 评论 -
温故知新之YOLOV4论文翻译
有大量的技巧可以提高卷积神经网络(CNN)的精度。需要在大数据集下对这种技巧的组合进行实际测试,并需要对结果进行理论论证。某些技巧仅在某些模型上使用和专门针对某些问题,或只针对小规模的数据集;而一些技巧,如批处理归一化、残差连接等,适用于大多数的模型、任务和数据集。我们假设这种通用的技巧包括加权残差连接跨小型批量连接。翻译 2024-10-20 09:39:06 · 55 阅读 · 0 评论 -
温故知新之YOLOV3论文翻译
我们对YOLO进行了一系列更新!它包含一堆小设计,可以使系统的性能得到更新。我们也训练了一个新的、比较大的神经网络。虽然比上一版更大一些,但是精度也提高了。不用担心,它的速度依然很快。YOLOv3在320×320输入图像上运行时只需22ms,并能达到28.2mAP,其精度和SSD相当,但速度要快上3倍。使用之前0.5 IOU mAP的检测指标,YOLOv3的效果是相当不错。翻译 2024-10-20 08:27:18 · 72 阅读 · 0 评论 -
温故知新之YOLOV2论文翻译
我们引入了一个先进的实时目标检测系统YOLO9000,可以检测超过9000个目标类别。首先,我们提出了对YOLO检测方法的各种改进,既有新发明的一些东西,也参考了前人的工作。改进后的模型YOLOv2在PASCAL VOC和COCO等标准检测任务上性能是最好的。使用一种新颖的、多尺度训练方法,同样的YOLOv2模型可以以不同的尺度运行,从而在速度和准确性之间获得了良好的权衡。以67FPS的检测速度,YOLOv2在VOC 2007上获得了76.8 mAP。翻译 2024-10-20 08:06:21 · 59 阅读 · 0 评论 -
温故知新之YOLOV1论文翻译
我们提出了一种新的目标检测方法YOLO。先前的目标检测工作重新使用分类器来执行检测。相反,我们将目标检测框架为空间分离的边界框和相关类概率的回归问题。单个神经网络在一次评估中直接从完整图像中预测边界框和类别概率。由于整个检测管道是一个单一的网络,因此可以直接对检测性能进行端到端的优化。我们的统一架构非常快。我们的基本YOLO模型以每秒45帧的速度实时处理图像。一个更小版本的网络,快速YOLO,每秒处理惊人的155帧,同时仍然达到其他实时探测器的两倍mAP。与最先进的检测系统相比,YOLO会产生更多的翻译 2024-10-20 07:23:36 · 53 阅读 · 0 评论 -
什么是梯度爆炸/梯度消失?
深度神经网络训练的时候,采用的是反向传播方式,该方式使用链式求导,计算每层梯度的时候会涉及一些连乘操作,因此如果网络过深。那么如果连乘的因子大部分小于1,最后乘积的结果可能趋于0,也就是梯度消失,后面的网络层的参数不发生变化.那么如果连乘的因子大部分大于1,最后乘积可能趋于无穷,这就是梯度爆炸如何防止梯度消失?sigmoid容易发生,更换激活函数为 ReLU即可。权重初始化用高斯初始化如何防止梯度爆炸?1 设置梯度剪切阈值,如果超过了该阈值,直接将梯度置为该值。2 使用ReLU转载 2022-01-08 15:32:06 · 24631 阅读 · 0 评论 -
【深度学习笔记】Batch Normalization 以及其如何解决梯度消失问题
前言Batch Normalization作为最近一年来DL的重要成果,已经广泛被证明其有效性和重要性。目前几乎已经成为DL的标配了,任何有志于学习DL的同学们朋友们雷迪斯俺的詹特曼们都应该好好学一学BN。BN倒过来看就是NB,因为这个技术确实很NB,虽然有些细节处理还解释不清其理论原因,但是实践证明好用才是真的好,别忘了DL从Hinton对深层网络做Pre-Train开始就是一个经验领先于理论分析的偏经验的一门学问。如何理解BatchNorm?请参考论文:Batch Normalization:转载 2022-01-08 15:24:06 · 5335 阅读 · 0 评论 -
BN(Batch Normalization) 原理与使用过程详解
论文名字:Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift论文地址:https://arxiv.org/abs/1502.03167 BN被广泛应用于深度学习的各个地方,由于在实习过程中需要修改网络,修改的网络在训练过程中无法收敛,就添加了BN层进去来替换掉LRN层,网络可以收敛。现在就讲一下Batch Normalization的工作原理。BN层和...转载 2022-01-08 15:17:26 · 1633 阅读 · 0 评论 -
ResNet网络解决的一些事
ResNet主要解决了网络退化以及梯度消失/爆炸这两个主要问题,使得网络可以通过加深提高准确率~深度卷积网络自然的整合了低中高不同层次的特征,特征的层次可以靠加深网络的层次来丰富。从而,在构建卷积网络时,网络的深度越高,可抽取的特征层次就越丰富。所以一般我们会倾向于使用更深层次的网络结构,以便取得更高层次的特征。但是在使用深层次的网络结构时我们会遇到两个问题,梯度消失/爆炸问题和网络退化的问题。 当使用更深层的网络时,会发生梯度消失/爆炸问题,这个问题很大程度通过标准的初始化和正则化层来基本解.转载 2022-01-08 15:13:40 · 2040 阅读 · 0 评论 -
ResNet 残差、退化等细节解读
说实话ResNet的网络结构参数真没有什么可以解读的,在本博客中我们主要了解(1)传统深度学习网络的退化问题(2)ResNet到底解决了什么问题?(3)简单了解下ResNet和残差结构(4)残差结构如何解决退化问题(5)残差结构还有什么其他作用?2016年CVPR Best Paperhttps://arxiv.org/abs/1512.03385 何凯明大神的作品。。有空多看看。1. 深度学习网络的退化问题 自AlexNet以来,以CNN为基石的网络模型越来越深(层数越来...转载 2022-01-08 15:09:26 · 2896 阅读 · 0 评论 -
CVPR2016:ResNet 从根本上解决深度网络退化问题
深度残差网络(Deep residual network, ResNet)的提出是CNN图像史上的一件里程碑事件,在2015年提出的时候便取得了五项第一,而何恺明大神也凭借这一paper斩获CVPR 2016 Best Paper Honorable Mention。目录背景(深度网络的退化问题) 残差结构 残差结构起作用的原因 网络结构 实验结果 论文地址背景(深度网络的退化问题)对于卷积神经网络,深度是一个很重要的因素。深度卷积网络自然的整合了低中高不同层次的特征,特征的层次.转载 2022-01-08 14:49:39 · 2238 阅读 · 0 评论 -
残差网络ResNet笔记
Deep Residual Learning for Image Recognition1. 思想作者根据输入将层表示为学习残差函数。实验表明,残差网络更容易优化,并且能够通过增加相当的深度来提高准确率。核心是解决了增加深度带来的副作用(退化问题),这样能够通过单纯地增加网络深度,来提高网络性能。作者在ImageNet上实验了一个152层的残差网络,比VGG深8倍,取得了3.57%的错误率。 作者通过一系列实验证明了表示的深度(即网络的深度)对很多视觉识别任务都至关重要。仅仅由于使用了非常深转载 2022-01-08 14:39:24 · 610 阅读 · 0 评论 -
深入理解ResNet原理解析及代码实现
github地址:https://github.com/pytorch/vision/blob/master/torchvision/models/resnet.py论文地址:https://arxiv.org/pdf/1512.03385.pdf解决什么问题 Is learning better networks as easy as stacking more layers? An obstacle to answering this question was the notorious...转载 2022-01-08 14:29:29 · 1087 阅读 · 0 评论 -
深度残差网络和Highway网络
今天讲的这两种网络结构都是最新被业界针对图像处理问题提出的最新的结构,主要解决就是超深层的网络在训练优化中遇到的问题。说实话这两种模型就本身来说数学公式都不复杂,但是确实在实战中取得了非常好的效果(深度残差网络帮助微软的团队以绝对优势获得了2015 Image Cup的冠军),这也从侧面说明了深度学习是一门以实践为主导的学科,在这个领域里实践才是检验真理的唯一标准。(很多新的结构都是因为在实践中取得了不错的效果,然后被一些大牛通过一些高大上概念进行包装,最后再以一种很牛逼的姿态传递到我们的面前,令我们膜拜)转载 2022-01-08 14:20:40 · 1085 阅读 · 0 评论 -
深入浅出之CNN模型中的shortcut
shortcut作为CNN模型中的一种有效结构,通过在网络层之间增加直接连接来缓解梯度发散问题并提高网络性能。它在Highway Networks、ResNet和DenseNet等模型中得到了广泛应用,并取得了显著的效果。在实际应用中,可以根据具体需求和网络结构选择合适的shortcut实现方式。原创 2022-01-08 13:43:57 · 2588 阅读 · 0 评论 -
MMDection
摘要我们介绍了MMDetection,这是一个对象检测工具箱,其中包含一组丰富的对象检测和实例分割方法以及相关的组件和模块。 该工具箱从赢得了COCO Challenge 2018检测轨道的MMDet团队的代码库开始。它逐渐发展成为一个涵盖许多流行检测方法和现代模块的统一平台。 它不仅包括训练和推理代码,而且还为200多个网络模型提供权重。 我们认为该工具箱是迄今为止最完整的检测工具箱。在本文中,我们介绍了此工具箱的各种功能。 此外,我们还对不同的方法,组件及其超参数进行了基准研究。我们希望该工具箱和基转载 2021-12-03 19:49:46 · 1068 阅读 · 0 评论 -
基于深度学习的目标检测算法综述(一)
基于深度学习的目标检测算法综述(一)基于深度学习的目标检测算法综述(二)基于深度学习的目标检测算法综述(三)本文内容原创,作者:美图云视觉技术部 检测团队,转载请注明出处目标检测(Object Detection)是计算机视觉领域的基本任务之一,学术界已有将近二十年的研究历史。近些年随着深度学习技术的火热发展,目标检测算法也从基于手工特征的传统算法转向了基于深度神经网络的检测技术。从最初2013年提出的R-CNN、OverFeat,到后面的Fast/Faster R-CNN,SSD,YOLO转载 2021-12-03 18:23:12 · 4189 阅读 · 0 评论 -
深度学习优化算法总结
动量(Momentum)算法动量(Momentum)的引入可以解决“峡谷”和“鞍点”问题的同时可以加速SGD在高曲率、小幅但是方向一致的梯度的情况下,原始的 SGD 在下降过程中会发生来回震荡;或者在鞍点处因为质量小速度很快减为 0,导致无法越过平地。动量方法使轨迹更加稳定;同时因为在鞍点处由于动量的作用,更容易越过平地。SDG加入动量参数更新公式其中,动量算法的变量 v 速度,相关的超参数 α(0.9)。原始 SGD 每次更新的步长只是梯度乘以学习率;加入动量的SDG的转载 2021-12-03 17:28:17 · 383 阅读 · 0 评论 -
“网络手术后”的ResNet——ResNeSt
ResNet变体作为目标检测、语义分割的骨干网络。modularSplit注意块,该注意块可以跨功能图组进行注意,通过叠加这些分割的注意块ResNet样式,得到了一个新的ResNet变体,称之为ResNeSt,保留了整个ResNet结构,可以直接用于下游任务,而不引入额外的计算成本。图像分类已经是计算机视觉研究中的一项基础又常见的工作。用于图像分类的神经网络通常是为其他应用而设计的神经网络的骨干,例如目标检测、语义分割和姿态估计。最近的工作通过大规模神经结构搜索(NAS)显著提高了图像分类的准确性。转载 2021-12-03 17:27:13 · 956 阅读 · 0 评论 -
一文总结调参技巧
调参数是深度学习工作中,必不可少的一步。“得参数者,得天下“那么,调参的方法常见的有哪些?小编为您总结一番~01寻找合适的学习率(learning rate)学习率是一个非常非常重要的超参数在面对不同规模、不同batch-size、不同优化方式、不同数据集时,学习率的最合适的值都是不确定的,所以,我们无法光凭经验来准确地确定学习率的值。策略:在训练中不断寻找最合适当前状态的学习率。下图利用fastai中的lr_find()函数寻找合适的学习率,根据下方的学习率-损失曲线得到此时合适的学习率为转载 2021-12-03 15:06:58 · 5641 阅读 · 0 评论 -
一文看尽深度学习中的20种卷积(附源码整理和论文解读)
引言卷积,是卷积神经网络中最重要的组件之一。不同的卷积结构有着不一样的功能,但本质上都是用于提取特征。比如,在传统图像处理中,人们通过设定不同的算子来提取诸如边缘、水平、垂直等固定的特征。而在卷积神经网络中,仅需要随机初始化一个固定卷积核大小的滤波器,并通过诸如反向传播的技术来实现卷积核参数的自动更新即可。其中,浅层的滤波器对诸如点、线、面等底层特征比较敏感,深层的滤波器则可以用于提取更加抽象的高级语义特征,以完成从低级特征到高级特征的映射。本文将从背景、原理、特性及改进四个维度分别梳理10篇影响力深远转载 2021-09-29 15:09:57 · 3864 阅读 · 0 评论 -
Batch Normalization
深度学习论文--Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift https://blog.youkuaiyun.com/kxh123456/article/details/100512998关于深度学习中的Batch normalization的理解 https://...原创 2019-11-05 10:58:35 · 126 阅读 · 0 评论 -
深度学习论文翻译--Deep Residual Learning for Image Recognition
本文翻译论文为深度学习经典模型之一:ResNet论文链接:https://arxiv.org/pdf/1512.03385.pdf摘要:深度神经网络很难训练,为了解决这个问题,我们提出残差学习框架(residual learning framework),使得神经网络的训练变得容易,并且我们的网络比之前所有的网络都要深。我们将网络层(layers)明确的定义为需要学习的残差函数(resid...转载 2019-11-05 10:19:28 · 1255 阅读 · 0 评论 -
基于深度学习的图像语义分割技术概述之4常用方法
本文为论文阅读笔记,不当之处,敬请指正。 A Review on Deep Learning Techniques Applied to Semantic Segmentation:原文链接4 深度学习图像分割的常用方法深度学习在多种高级计算机视觉任务中的成功—特别是监督CNNs(Convolutional Neural Networks,卷积神经网络)在图像分类、物体检测方面的成功—鼓舞着研究...转载 2018-05-29 09:54:39 · 842 阅读 · 0 评论 -
论文笔记 OHEM: Training Region-based Object Detectors with Online Hard Example Mining
CVPR2016的文章,CMU与rbg大神的合作。原谅我一直没有对这篇文章做一个笔记~~文章提出了一种通过online hard example mining(OHEM)算法训练基于区域的卷积检测算子的高效目标检测算法,能够对简单样本和一些小数量样本进行抑制,使得训练过程更加高效。该方法利用显著的bootstrapping技术(SVM中被普遍利用),对SGD算法进行一定的修改,使得原有的regio...转载 2018-05-05 14:38:20 · 310 阅读 · 0 评论 -
DSSD: Deconvolutional Single Shot Detector 论文笔记
论文地址:DSSD : Deconvolutional Single Shot Detector 项目地址:Github概述这篇论文应该算是SSD: Single Shot MultiBox Detector的第一个改进分支,作者是Cheng-Yang Fu, 我们熟知的Wei Liu大神在这里面是第二作者,说明是一个团队的成果,论文很新,暂未发布源代码。博主对该文章重要部分做了翻译理解工作,不一...转载 2018-04-04 10:49:50 · 573 阅读 · 0 评论 -
翻译SSD论文(Single Shot MultiBox Detector)
本文原创,未经博主允许,请勿转载。每晚泡脚,闲来无事,所以就边泡边翻译了SSD论文,总感觉英文看着不习惯,还是中文好理解,也是和大家一起学习。菜鸟水平有限,恳求大家指出错误之处。本翻译仅作交流之用,请勿用于其他。SSD: Single Shot MultiBoxDetector Wei Liu1 , Dragomir Anguelov2 ,Dumitru Erhan3 , Christian Sz...转载 2018-04-04 09:16:42 · 621 阅读 · 0 评论 -
目标检测之RCNN,SPP-NET,Fast-RCNN,Faster-RCNN
写在前面在深度学习出现之前,传统的目标检测方法大概分为区域选择(滑窗)、特征提取(SIFT、HOG等)、分类器(SVM、Adaboost等)三个部分,其主要问题有两方面:一方面滑窗选择策略没有针对性、时间复杂度高,窗口冗余;另一方面手工设计的特征鲁棒性较差。自深度学习出现之后,目标检测取得了巨大的突破,最瞩目的两个方向有:1 以RCNN为代表的基于Region Proposal的深度学习目转载 2018-01-30 10:23:26 · 763 阅读 · 0 评论 -
目标检测之YOLOv2
写在前面前篇文章介绍了基于回归方法的深度学习目标检测方法(YOLO,SSD),本篇将介绍YOLO的升级版YOLOv2,其主要有两个大方面的改进:(1) 使用一系列的方法对YOLO进行了改进,在保持原有速度的同时提升精度得到YOLOv2;(2) 提出了一种目标分类与检测的联合训练方法,通过WordTree来混合检测数据集与识别数据集之中的数据,同时在COCO和ImageNet数据集中进行训练转载 2018-01-30 10:20:23 · 1527 阅读 · 0 评论 -
目标检测方法系列:R-CNN, SPP, Fast R-CNN, Faster R-CNN, YOLO, SSD
本文转载自:http://www.cnblogs.com/lillylin/p/6207119.html目标检测方法系列——R-CNN, SPP, Fast R-CNN, Faster R-CNN, YOLO, SSD 目录相关背景从传统方法到R-CNN从R-CNN到SPPFast R-CNNFaster R-转载 2018-01-30 09:41:31 · 448 阅读 · 0 评论 -
论文阅读 R-FCN: Object Detection via Region-based Fully Convolutional Networks
本文转载自:http://www.cnblogs.com/lillylin/p/6277094.htmlR-FCN论文阅读(R-FCN: Object Detection via Region-based Fully Convolutional Networks ) 目录作者及相关链接方法概括方法细节实验结果总结参考文献转载 2018-01-30 09:39:38 · 232 阅读 · 0 评论 -
SSD论文阅读(Wei Liu——【ECCV2016】SSD Single Shot MultiBox Detector)
本文转载自:http://www.cnblogs.com/lillylin/p/6207292.htmlSSD论文阅读(Wei Liu——【ECCV2016】SSD Single Shot MultiBox Detector) 目录作者及相关链接文章的选择原因方法概括方法细节相关背景补充实验结果与相关文章的对比总结转载 2018-01-30 09:38:14 · 853 阅读 · 0 评论 -
Light Head R-CNN论文笔记
先上链接: 论文:Light-Head R-CNN: In Defense of Two-Stage Object Detector 链接:https://arxiv.org/abs/1711.07264 代码: TF链接introduction本篇文章介绍的算法是是旷视和清华大学在COCO 2017比赛拿到冠军的算法。目前常用的object detection框架有两种:一种是基于...转载 2018-09-17 15:28:10 · 216 阅读 · 0 评论 -
基于空间金字塔池化的卷积神经网络物体检测
原文地址:http://blog.youkuaiyun.com/hjimce/article/details/50187655作者:hjimce一、相关理论 本篇博文主要讲解大神何凯明2014年的paper:《Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition》,这篇paper主要的创新点在...转载 2018-09-18 08:46:35 · 295 阅读 · 0 评论 -
目标检测--Selective Search for Object Recognition(IJCV, 2013)
Selective Search for Object Recognition作者: J. R. R. Uijlings, K. E. A. van de Sande, T. Gevers, A. W. M. Smeulders.引用: Uijlings, Jasper RR, et al. "Selective search for object recognition." Intern...转载 2018-09-18 09:05:34 · 535 阅读 · 0 评论 -
目标检测论文阅读:Cascade R-CNN: Delving into High Quality Object Detection
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.youkuaiyun.com/qq_21949357/article/details/80046867 Cascade R-CNN: Delving into High Quality Object Detection 1.思想简介 2.相关工作及一些证明 Iter...转载 2018-10-24 10:07:53 · 333 阅读 · 0 评论