
深度学习论文导航
文章平均质量分 94
阅读论文,加强理论支撑,最终目标设计出自己的作品~
AI 菌
算法工程师一枚,优快云博客专家;NLP、CV、语音算法跨界选手,欢迎一起交流学习!
展开
-
YOLOv10:实时端到端目标检测的新突破
清华接手,YOLOv10问世:性能大幅提升,登上GitHub热榜!原创 2024-06-03 01:33:31 · 2515 阅读 · 2 评论 -
【音频分类与检测】PANNs:用于音频模式识别的大规模预训练音频神经网络
音频模式识别是机器学习领域的一个重要研究课题,它包括音频标注、声音场景分类、音乐分类、语音情感分类和声音事件检测等任务。近年来,神经网络已被应用于解决音频模式识别问题。然而,以前的系统是建立在特定数据集上的,数据集时长有限。最近,在计算机视觉和自然语言处理中,在大规模数据集上进行预训练的系统已经很好地推广到一些任务上了。然而,在大规模数据集上进行音频模式识别的预训练系统的研究还很有限。本文提出了在大规模音频数据集上训练的预训练音频神经网络(PANN)。原创 2023-01-15 22:02:52 · 10053 阅读 · 5 评论 -
【CBAM 解读】混合注意力机制:Convolutional Block Attention Module
本文提出了卷积块注意模块(CBAM),这是一种简单而有效的前馈卷积神经网络注意模块。原创 2022-11-13 23:48:59 · 12230 阅读 · 0 评论 -
【SCA-CNN 解读】空间与通道注意力:Spatial and Channel-wise Attention
SCA-CNN在多层特征映射中动态调整句子生成上下文,编码重要的空间位置和通道特征。原创 2022-06-10 17:00:02 · 7631 阅读 · 0 评论 -
【SENet 解读】通道注意力:Squeeze-and-Excitation Networks
通道注意力机制SENet原创 2022-06-06 09:47:18 · 3551 阅读 · 5 评论 -
实时立体匹配网络StereoNet
概要本文介绍了首个用于实时立体匹配的端到端深度架构StereoNet,该架构可在NVidia Titan X上以60fps运行,生成高质量、边缘保持、无量化的视差图。本文的一个关键观点是,该网络的亚像素匹配精度比传统的立体匹配方法高出一个量级。这允许我们通过使用非常低的分辨率成本来实现实时性能,编码所需的所有信息,以实现高视差精度。一、引入立体匹配是一个经典的计算机视觉问题,它涉及到从两幅轻微位移的图像中估计深度。随着人们对虚拟现实和增强现实的兴趣日益浓厚,深度估计技术最近被推向了研究的中心。它是很.原创 2022-01-04 17:19:46 · 7448 阅读 · 3 评论 -
Mask R-CNN解读
实例分割经典论文解读!原创 2021-12-16 21:08:15 · 1821 阅读 · 0 评论 -
【NIPS2018】实时联合目标检测与语义分割网络
本文发表于第32届神经信息处理系统会议(NIPS 2018),是法国汽车零部件供应商法雷奥集团(Valeo)研究提出的一种用于自动驾驶领域的多任务神经网络,可同时执行目标检测与语义分割任务。原创 2021-12-11 20:42:30 · 7226 阅读 · 3 评论 -
【Disp R-CNN解读】通过形状先验引导的立体三维目标检测实例视差估计
本文提出了一种新的立体图像三维目标检测系统 Disp R-CNN。原创 2021-12-01 21:19:52 · 3891 阅读 · 0 评论 -
【ZoomNet 解读】局部感知自适应缩放神经网络的三维目标检测
三维目标检测是自动驾驶和机器人技术中的一项重要任务。虽然已经取得了很大的进展,但在估算遥远和闭塞物体的三维姿态方面仍然存在挑战。原创 2021-11-25 21:39:40 · 4011 阅读 · 0 评论 -
【DSGN 解读】用于三维目标检测的深度立体几何网络
本文提供了一种简单有效的基于立体的单级三维检测管道,以端到端学习的方式联合估计深度和检测三维物体。原创 2021-11-19 21:19:39 · 3760 阅读 · 0 评论 -
【Stereo R-CNN 解读】基于立体R-CNN的自动驾驶三维目标检测
本文充分利用立体图像中的稀疏、密集、语义和几何信息,提出了一种用于自动驾驶的三维目标检测方法。我们的方法,称为 Stereo R-CNN,扩展了 Faster R-CNN 用于立体输入,以同时检测和关联左右图像中的目标。我们在立体区域建议网络(RPN)之后增加额外的分支来预测稀疏的关键点、视点和对象尺寸,并结合左右图像中的2D边界框来计算粗略的3D目标边界框。然后,我们通过使用左右感兴趣区域的基于区域的光度对齐来恢复准确的3D边界框。我们的方法不需要深度depth输入和3D位置监督,但是,它的性能优.原创 2021-11-06 11:15:40 · 3280 阅读 · 0 评论 -
【DLT-Net 解读】可行驶区域、车道线和交通目标的联合检测
本文提出了一种统一的神经网络DLT-Net来同时检测可行驶区域、车道线和交通对象。除此之外,还提出了一个上下文张量来嵌入和共享子网之间的互信息,在不增加大量开销的情况下显著提高了整体性能。原创 2021-10-27 09:23:40 · 4579 阅读 · 4 评论 -
【MultiNet 解读】Real-time Joint Semantic Reasoning for Autonomous Driving
本文发表于2018年 IEEE IV上,提出了一种联合分类、检测和语义分割的方法 MultiNet,该方法使用一个统一的架构,其中编码器在三个任务之间共享。该方法结构简单,可以进行端到端的训练,并且在具有挑战性的KITTI数据集中表现得非常好。原创 2021-10-08 10:23:57 · 1967 阅读 · 0 评论 -
【YOLOX 解读】与 YOLOv5 匹敌的 anchor-free 目标检测器!
旷世首发,新一代 Anchor-free 目标检测框架!原创 2021-08-05 18:48:33 · 10857 阅读 · 6 评论 -
【Fast-SCNN】一种快速语义分割网络
本文发布于BMVC2019,是由英国东芝研究院Rudra、Stephan和剑桥大学Roberto共同完成的。本文的亮点是提出了一种快速的语义分割网络 Fast-SCNN,在 NVIDIA Titan XP GPU 上测试表明,在Cityscapes数据集上的mIOU达到68.0%,速度达到123.5帧/秒。原创 2021-07-16 09:41:38 · 4174 阅读 · 3 评论 -
【MultiNet】用于自动驾驶的实时联合语义推理
本文由多伦多大学、剑桥大学、Uber等合作完成,发表于 2018 IEEE Intelligent Vehicles Symposium (IV),Changshu, Suzhou, China。该研究提出了一种联合分类、检测和语义分割的统一架构,并且该项目已经开源:[https://github.com/MarvinTeichmann/MultiNet](https://github.com/%20MarvinTeichmann/MultiNet)原创 2021-07-07 10:48:33 · 2003 阅读 · 7 评论 -
【YUV-MultiNet】用于自动驾驶的实时YUV多任务CNN
本文提出了一种针对低功耗车用SoC优化的多任务卷积神经网络(CNN)结构。原创 2021-06-30 08:55:12 · 2351 阅读 · 3 评论 -
【MultiNet】用于自动驾驶的多模态多任务学习网络
本文发表于2019年的IEEE计算机视觉应用冬季会议上,是一篇有关自动驾驶领域多模态多任务网络应用的文章。原创 2021-06-27 18:57:35 · 3620 阅读 · 12 评论 -
深度学习模型压缩与加速综述
七大模型压缩与加速方法总结:参数剪枝、参数量化、紧凑网络、知识蒸馏、低秩分解、参数共享原创 2021-03-18 14:22:54 · 3830 阅读 · 0 评论 -
深度学习论文导航 | 17 EfficientNet:重新思考卷积神经网络模型缩放
这篇论文发表于机器学习国际顶级会议ICML2019,作者通过系统地研究发现,仔细平衡网络的深度、宽度和分辨率可以带来更好的性能。因此提出了一种新的缩放方法,即使用简单而高效的**复合系数**来均匀缩放深度、宽度和分辨率三个维度,从而使得模型效率大大提升。原创 2020-12-25 21:44:00 · 3478 阅读 · 2 评论 -
深度学习论文导航 | 16 Pelee:移动设备上的实时目标检测系统
这篇文章发表于NIPS2018,该研究试图探索设计一种高效的CNN架构,使得CNN能够在计算能力和内存资源有限的移动设备上运行。与常规的用于轻量级网络的深度可分离卷积不同,PeleeNet是通过常规卷积构建的。经过实验表明,PeleeNet在移动设备 NVIDIA TX2 和 iPhone 均能快速运行。且在一些著名的数据集上的测试结果显示,PeleeNet在不损失精度的情况下,速度都可以得到一定的提升,是一个不错的轻量级网络。原创 2020-12-24 10:11:05 · 2080 阅读 · 0 评论 -
吴恩达亲述:如何高效阅读论文,开启一个新的领域!
著名AI大佬吴恩达,亲述高效阅读论文方法,赶紧学起来!原创 2020-11-25 16:06:34 · 2239 阅读 · 2 评论 -
深度学习阅读导航 | 15 YOLOv4:最佳速度与精确度的目标检测器
你知道的不知道的,都在这里!原创 2020-07-22 15:03:34 · 12572 阅读 · 13 评论 -
【CSPNet 解读】一种增强CNN学习能力的新型骨干网络
这篇文章发表于CVPR2019,提出了跨阶段局部网络(CSPNet),以缓解以往的工作需进行大量推理计算的问题。在当前风靡一时的YOLOv4目标检测网络中,也引用了CSPNet作为骨干网络。原创 2020-12-11 11:28:43 · 5929 阅读 · 3 评论 -
深度学习论文导航 | 13 PointNet++:度量空间中点云的深层层次特征学习
小白必会——深度学习点云处理系列原创 2020-07-19 14:49:59 · 3355 阅读 · 1 评论 -
深度学习论文导航 | 12 PointNet:深度学习在3D点云分类与分割上的应用
激光雷达、3D点云、深度学习等持续更新中......原创 2020-07-12 15:04:05 · 3939 阅读 · 9 评论 -
深度学习论文导航 | 11 LaneNet:基于实例分割方法的车道线检测网络
无人驾驶技术环境感知篇——车道线检测网络LaneNet原创 2020-09-12 18:19:01 · 7469 阅读 · 1 评论 -
深度学习阅读导航 | 10 YOLOv1:实时的端到端目标检测网络
学习论文:YOLO: Unified, Real-Time Object Detection核心思想YOLO 的核心思想就是把目标检测转变成一个回归问题,利用整张图作为网络的输入,仅仅经过一个神经网络,得到bounding box(边界框) 的位置及其所属的类别。实现过程将一幅图像分成 S*S个网格(grid cell),如果某个 object 的中心落在这个网格中,则这个网格就负责预...原创 2020-02-13 00:31:18 · 1241 阅读 · 0 评论 -
深度学习论文导航 | 09 DenseNet:稠密连接卷积神经网络
全网最详细的深度学习——DenseNet讲解,配套手把手实战讲解~原创 2020-05-01 17:04:26 · 5391 阅读 · 47 评论 -
深度学习论文导航 | 08 ResNet:用于图像识别的深度残差网络
全网最详细的解析——残差网络ResNet原创 2020-04-17 13:23:22 · 8063 阅读 · 55 评论 -
深度学习论文导航 | 07 PANet:用于实例分割的路径聚合网络
【深度学习必读论文 第7篇】原创 2020-11-27 12:33:04 · 4554 阅读 · 4 评论 -
深度学习论文导航 | 06 SSP-Net:深度卷积网络中的空间金字塔池用于视觉识别
这是一篇比较老的文章了,是何恺明大神于2015年在IEEE上发表的,到目前为止被引用量已经达到2038。原创 2020-12-12 13:05:57 · 2618 阅读 · 0 评论 -
深度学习阅读导航 | 05 基于光照感知深度神经网络的多光谱数据融合行人检测
深度学习必读系列,全天候目标检测!原创 2020-11-09 10:23:34 · 5327 阅读 · 3 评论 -
深度学习阅读导航 | 04 FPN:基于特征金字塔网络的目标检测
深度学习、计算机视觉必读系列!原创 2020-11-13 23:02:44 · 3631 阅读 · 2 评论 -
深度学习阅读导航 | 03 GoogLeNet:Going deeper with convolutions
写在前面:大家好!我是【AI 菌】,一枚爱弹吉他的程序员。我热爱AI、热爱分享、热爱开源! 这博客是我对学习的一点总结与记录。如果您也对 深度学习、机器视觉、算法、C++ 感兴趣,可以关注我的动态,我们一起学习,一起进步~我的博客地址为:【AI 菌】的博客文章目录摘要1. 介绍2. 相关工作3. 动机和高层级的考虑4. 结构细节5. GooLeNet网络6. 训练方法7. ILSVRC 2...翻译 2020-04-11 18:29:23 · 2540 阅读 · 32 评论 -
深度学习阅读导航 | 02 Faster R-CNN:基于RPN的实时目标检测
目标检测经典之作:Faster R-CNN论文讲解,后续更新手把手实战教程,小白看了都会~...原创 2020-05-08 21:06:04 · 11955 阅读 · 46 评论 -
深度学习论文导航 | 01 R-CNN:用于精确目标检测和语义分割的丰富特征层次
深度学习目标检测开山之作翻译 2020-02-20 12:59:51 · 2042 阅读 · 1 评论