论文
文章平均质量分 96
各种机器学习、目标检测、深度学习等等论文
hero_hilog
一命二运三风水四积阴德五读书
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
VGG论文(2015)(经典分类网络)
3×3本研究探讨了卷积网络深度在大规模图像识别任务中对准确率的影响。我们的主要贡献是采用极小3×3卷积核架构对不同深度网络进行了全面评估,结果表明当网络深度达到16-19个权重层时,能在现有最优配置基础上实现显著提升。这些发现构成了我们参加2014年ImageNet竞赛的基础方案,最终团队在定位和分类赛道分别斩获冠亚军。我们还证明该表征方法能有效迁移至其他数据集,并取得当前最优性能。为促进深度视觉表征在计算机视觉领域的进一步研究,我们已将两个最佳卷积网络模型开源发布。原创 2025-09-19 11:00:01 · 808 阅读 · 0 评论 -
Attention is All You Need(Transformer提出的论文)
本文提出了Transformer模型,这是一种完全基于注意力机制的新型神经网络架构,摒弃了传统的循环和卷积结构。原创 2025-06-26 18:17:32 · 626 阅读 · 0 评论 -
Learning Transferable Visual Models From Natural Language Supervision(CLIP论文)
clip论文原创 2025-06-06 18:13:28 · 619 阅读 · 0 评论 -
Towards Open World Object Detection概述(OWOD论文)
1人类天生具备识别环境中未知物体实例的本能。当相关知识最终可获得时,对这些未知实例的内在好奇心有助于人们认知它们。这促使我们提出一个名为"开放世界目标检测"的新型计算机视觉问题,该模型需要完成两项任务:1)在没有明确监督的情况下,将未接触过的物体识别为"未知";2)在逐步获得相应标签时,能够持续学习这些已识别的未知类别而不遗忘先前习得的类别。我们构建了问题框架,制定了严格的评估标准,并提出基于对比聚类和能量检测的未知识别新方法ORE(开放世界目标检测器)。原创 2025-06-04 18:29:12 · 1562 阅读 · 0 评论 -
YOLO-UniOW概述(论文)
传统的目标检测模型受到闭集数据集的限制,仅检测训练过程中遇到的类别。虽然多模态模型通过对齐文本和图像模态扩展了类别识别,但由于跨模态融合,它们引入了显著的推理开销,并且仍然受到预定义词汇的限制,使得它们在处理开放世界场景中的未知对象时无效。在这项工作中,我们引入了通用开放世界对象检测(Uni-OWD),这是一种将开放词汇表和开放世界对象探测任务相结合的新范式。为了解决这种设置的挑战,我们提出了YOLO-UniOW,这是一种新的模型,可以提高效率、多功能性和性能的界限。原创 2025-05-28 18:20:07 · 1256 阅读 · 0 评论 -
目标检测 | yolov10 原理和介绍
在过去的几年里,YOLO 已成为实时目标检测领域的主要范式,因为它们在计算成本和检测性能之间有效平衡。研究人员探索了 YOLO 的架构设计、优化目标、数据增强策略等,取得了显着进展。然而,对非最大抑制(NMS)进行后处理的依赖阻碍了YOLO的端到端部署,并对推理延迟产生不利影响。此外,YOLOs中各个组件的设计缺乏全面和彻底的检测,导致计算冗余明显,限制了模型的能力。它使次优效率,以及性能改进的巨大潜力。在这项工作中,我们的目标是从后处理和模型架构中进一步推进 YOLO 的性能效率边界。原创 2024-08-20 19:59:49 · 6468 阅读 · 0 评论 -
目标检测 | yolov9 原理和介绍
今天的深度学习方法侧重于如何设计最合适的目标函数,以便模型的预测结果可以最接近基本事实。同时,必须设计能够促进获取足够信息进行预测的适当架构。现有方法忽略了输入数据经过逐层特征提取和空间变换时的事实,会丢失大量信息。当数据通过深度网络传输时,本文将深入研究数据丢失的重要问题,即信息瓶颈和可逆函数。我们提出了可编程梯度信息 (PGI) 的概念来应对深度网络实现多个目标所需的各种变化。PGI可以为目标任务提供完整的输入信息来计算目标函数,从而获得可靠的梯度信息来更新网络权重。原创 2024-08-20 14:58:38 · 3180 阅读 · 0 评论 -
目标检测 | yolov7 原理和介绍
YOLOv7是目标检测领域中YOLO系列的最新进展,它在速度和准确性上都取得了显著的提升,被认为是目标检测领域的新里程碑。模型重参数化:YOLOv7首次将模型重参数化技术引入网络架构中,这一技术最早在REPVGG中提出,有助于提升模型表达能力而不增加计算复杂度。标签分配策略:YOLOv7采用了结合YOLOv5和YOLOX优点的标签分配策略,通过跨网格搜索和匹配策略,提高了检测准确性。原创 2024-08-16 18:16:28 · 5820 阅读 · 0 评论 -
目标检测 | yolov6 原理和介绍
YOLOv6是由美团视觉智能部研发的一款目标检测框架,专注于工业应用,致力于提供极致的检测精度和推理效率。相较于YOLOv4和YOLOv5,YOLOv6在网络结构方面进行了深入优化,提升了模型的检测精度,并在处理复杂场景时更加稳健。同时,YOLOv6还在保持高效性的基础上,减少了模型的参数量,适合在移动端等计算资源有限的设备上运行。YOLOv6的改进包括采用轻量级的卷积模块和引入注意力机制,更好地捕捉图像中的关键信息。它还针对小目标检测问题进行了优化,改进了锚框的生成方式,适应不同尺寸的目标。原创 2024-08-15 20:44:29 · 3033 阅读 · 0 评论 -
目标检测 | yolov4 原理和介绍
YOLOv4是一种高效且准确的目标检测模型,它在YOLOv3的基础上引入了多项改进,这些改进主要集中在网络结构的优化和训练技巧的更新上。论文链接:https://arxiv.org/abs/2004.10934时间:2020年作者:Alexey Bochkovskiy代码参考:https://github.com/Tianxiaomo/pytorch-YOLOv4大量的特征据说可以提高卷积神经网络(CNN)的精度。需要在大数据集上对这些特征的组合进行实际测试,并对结果进行理论证明。原创 2024-08-06 16:18:03 · 2754 阅读 · 0 评论 -
目标检测 | yolov3 原理和介绍
YOLOv3 擅于预测出合适的目标,但无法预测出非常精准的边界框。YOLOv3 小目标预测能力提升,但中大目标的预测反而相对较差。若将速度考量进来,YOLOv3 整体来说表现非常出色。YOLOv3在小目标\密集目标的改进1.grid cell个数增加,YOLOv1(7×7),YOLOv2(13×13),YOLOv3(13×13+26×26+52×52)2.YOLOv2和YOLOv3可以输入任意大小的图片,输入图片越大,产生的grid cell越多,产生的预测框也就越多。原创 2024-08-05 18:41:17 · 4337 阅读 · 0 评论 -
目标检测 | yolov2/yolo9000 原理和介绍
论文链接:https://arxiv.org/abs/1612.08242时间:2016年作者:Joseph Redmon作者首先在YOLOv1的基础上提出了改进的YOLOv2,然后提出了一种检测与分类联合训练方法,使用这种联合训练方法在COCO检测数据集和ImageNet分类数据集上训练出了YOLO9000模型,其可以检测超过9000多类物体。所以,这篇文章其实包含两个模型:YOLOv2和YOLO9000,不过后者是在前者基础上提出的,两者模型主体结构是一致的。原创 2024-08-01 19:05:30 · 1546 阅读 · 0 评论 -
目标检测 | yolov1 原理和介绍
论文链接:https://arxiv.org/abs/1506.02640时间:2015年作者:Joseph Redmon代码参考:https://github.com/abeardear/pytorch-YOLO-v1。原创 2024-08-01 17:11:39 · 1773 阅读 · 0 评论
分享