- 博客(15)
- 收藏
- 关注
原创 yolov7-学习笔记
实时目标检测是计算机视觉中一个非常重要的主题,因为它通常是计算机视觉系统中的必要组件。例如,多目标跟踪[94、93]、自动驾驶[40、18]、机器人技术[35、58]、医学图像分析[34、46]等。执行实时目标检测的计算设备是通常是一些移动CPU或GPU,以及各大厂商开发的各种神经处理单元(NPU)。
2023-03-12 10:03:17
1407
原创 yolov6用于工业应用的单级目标检测框架
YOLO 系列一直是工业应用中最受欢迎的检测框架,因为它在速度和准确性之间取得了出色的平衡。YOLO 系列的开创性工作是 YOLOv1-3 [32-34],随着后来的实质性改进,它开辟了单级检测器的新道路。YOLOv4 [1] 将检测框架重组为几个独立的部分(主干、颈部和头部),并在当时验证了 bag-of-freebies 和 bag-of-specials 以设计适合在单个 GPU 上训练的框架。
2023-03-11 14:52:13
1511
2
原创 Searching for MobileNetV3 学习笔记
我们展示了基于互补搜索技术和新颖架构设计组合的下一代 MobileNet。通过硬件感知网络架构搜索 (NAS) 与 NetAdapt 算法相结合的方式针对手机 CPU 进行调整,然后通过新颖的架构改进进行改进。本文开始探索自动搜索算法和网络设计如何协同工作以利用互补方法改进整体技术水平。通过这个过程,我们创建了两个新的 MobileNet 模型以供发布:MobileNetV3-Large 和 MobileNetV3-Small,它们分别针对高资源和低资源用例。
2023-02-24 22:25:16
743
原创 MobileNetV2 Inverted Residuals and Linear Bottlenecks(MobileNetV2倒残差和线性瓶颈)学习笔记
神经网络已经彻底改变了机器智能的许多领域,使具有挑战性的图像识别任务具有超人的准确性。然而,提高准确性的动力往往是有代价的:现代最先进的网络需要高计算资源,超出了许多移动和嵌入式应用程序的能力。本文介绍了一种新的神经网络体系结构,它专门为移动和资源受限的环境量身定制。我们的网络通过显著减少所需的操作数量和内存,同时保持相同的精度,推动了移动定制计算机视觉模型的最先进水平。我们的主要贡献是一个新的层模块:带线性瓶颈的反向残差。该模块。
2023-02-23 16:56:58
629
原创 MobileNetV1学习笔记
自从AlexNet通过赢得ImageNet挑战赛:ILSVRC 2012而普及了深度卷积神经网络以来,卷积神经网络在计算机视觉中已经无处不在。为了达到更高的精度,一般的趋势是构建更深、更复杂的网络。然而,这些提高准确性的进步并不一定会使网络在规模和速度方面更有效。在许多现实世界的应用中,如机器人、自动驾驶汽车和增强现实,识别任务需要在计算有限的平台上及时执行。本文描述了**一种高效的网络架构和一组两个超参数,以构建非常小,低延迟的模型,可以很容易地匹配移动和嵌入式视觉应用程序的设计需求。
2023-02-21 22:14:49
221
原创 HRIPCB a challenging dataset for PCB defects detection and classification学习笔记
印刷电路板(PCB)是电子设备中放置大量元件的基本载体。pcb的质量将直接影响电子器件的性能。为了避免人工检测容易疲劳、效率低等缺点,自动化光学检测在工业上得到了广泛的应用。随着PCB向着更高精度和密度的方向发展,PCB变得越来越复杂,缺陷检测和分类的任务也比以前更加困难。目前,虽然有一些关于PCB缺陷检测的论文,但这些论文都使用自己的数据集。由于缺乏开放数据集,导致无法评估各种方法。为了解决上述问题,本文提出了一个具有缺陷的公共彩色合成PCB数据集,供其他想要设计和评估其方法的人使用。
2023-02-19 21:00:50
1416
3
原创 EfficientRep An Efficient Repvgg-style ConvNets with Hardware-aware Neural Network Design
作者提出了一种硬件高效的卷积神经网络架构,它具有类似repvgg的架构。Flops或参数是评估网络效率的传统指标,对包括计算能力和内存带宽在内的硬件不敏感。因此,如何设计一个有效利用硬件计算能力和内存带宽的神经网络是一个关键问题。提出了一种硬件感知神经网络的设计方法。在此基础上,我们设计了具有高计算量硬件(如计算机硬件)的EfficientRep系列卷积网络。图形处理器友好,应用于YOLOv6对象检测框架。
2023-02-18 15:52:50
1829
1
原创 AlexNet
当前对象识别方法主要使用机器学习方法。为了提高它们的性能,我们可以收集更大的数据集,学习更强大的模型,并使用更好的技术来防止过度拟合。直到最近,标记图像的数据集相对较小——数量级为数万张图像(例如,NORB、19 Caltech-101/256和 CIFAR-10/100 )。使用这种大小的数据集可以很好地解决简单的识别任务,尤其是当它们增加了标签保留转换时。例如,MNIST 数字识别任务的当前最佳错误率 (
2022-12-01 16:52:10
669
原创 YOLOX Exceeding YOLO Series in 2021
随着目标检测的发展,YOLO 系列始终追求实时应用的最佳速度和精度权衡。它们采用了当时可用的最先进的检测技术(例如, 用于 YOLOv2 的锚点框,YOLOv3的残差网络 )并优化实现以实现最佳实践。目前,YOLOv5在 COCO 上以 13.7 ms 的 48.2% AP 保持最佳权衡性能。尽管如此,在过去的两年中,目标检测学术界的主要进展集中在无锚框检测器、高级标签分配策略和端到端(无 NMS)检测器。
2022-11-09 19:46:08
301
原创 attention is all you need
循环神经网络、长短期记忆 和门控循环神经网络,已被牢固地确立为序列建模和转导问题(如语言建模和机器翻译)的最先进方法。循环模型通常沿输入和输出序列的符号位置考虑计算。将位置与计算时间的步骤对齐,它们生成一系列隐藏状态 ht,作为先前隐藏状态 ht-1 和位置 t 的输入的函数。这种固有的顺序性质排除了训练示例中的并行化,这在更长的序列长度下变得至关重要,因为内存限制限制了示例之间的批处理。最近的工作通过因式分解技巧和条件计算显着提高了计算效率,同时还提高了后者的模型性能。然而,顺序计算的基本约束仍然存在。
2022-11-07 21:46:16
738
原创 yolov4
据说有大量功能可以提高卷积神经网络 (CNN) 的准确性。需要在大型数据集上对这些特征的组合进行实际测试,并对结果进行理论证明。某些功能专门针对某些模型和某些问题专门操作,或仅针对小规模数据集;而一些特性,例如批量归一化和残差连接,适用于大多数模型、任务和数据集。我们假设这些通用特征包括加权残差连接 (WRC)、跨阶段部分连接 (CSP)、交叉小批量标准化 (CmBN)、自我对抗训练 (SAT) 和 Mish 激活。
2022-10-29 18:26:55
2113
原创 yolov3
yolov3只是增加了一点小小的改进,虽然模型比yolov2稍微大一点,但是它的准确度增加了。在320x320分辨率图片上,可以在22毫秒的速度上达到28.2的mAP,准确度和SSD相当,但是速度是它的三倍。在Titan X上,它在51毫秒内达到57.9 AP50(0.5IOUmAP),而在RetinaNet上,它在198毫秒内才能达到57.5 AP50,性能相似,但是yolov3的速度快3.8倍。这篇介绍的结尾将为本文的其余部分指明方向。首先,YOLOv3是怎么回事。然后作者是怎么做的。
2022-10-22 08:54:49
1818
原创 YOLO9000 Better, Faster, Stronger
yolo9000,最先进的,实时的目标检测系统,可以检测超过9000个类别。yolov2提出了很多新的改进方法,无论是新的还是在原有的yolov1中汲取的。yolov2使用新颖的,多尺度训练方法,它可以在各种尺寸的图片上运行(yolov1固定图片尺寸448*448),从而在速度与准确度之间平衡。
2022-10-15 20:25:02
2429
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人