- 博客(143)
- 资源 (2)
- 收藏
- 关注
原创 【论文解读】Segment Anything 分割一切大模型(附论文地址)
这是一项新的图像分割任务、模型和数据集。我们构建了迄今为止最大的分割数据集,包含超过10亿个掩码,覆盖了1100万张图像。该模型被设计和训练为可提示的(promptable),因此它能够通过提示工程零样本迁移到新的图像分布和任务。我们在众多任务上评估了它的能力,并发现它的零样本性能令人印象深刻——通常与或甚至优于以前的全监督结果。在自然语言处理(NLP)中,提示(prompt)的概念被用来指导语言模型生成特定任务的有效文本响应。
2025-04-03 09:00:00
617
原创 【论文源码实战】Pose2Seg:无检测人体实例分割
本文介绍了一种名为Pose2Seg的新型人体实例分割框架,它不依赖于传统的目标检测方法,而是直接利用人体姿态信息来区分和分割图像中的个体。这一方法特别适用于处理人体重叠和遮挡的情况,这些情况在以往的目标检测基础上的分割方法中是一个难题。Pose2Seg框架通过一个称为Affine-Align的对齐模块,基于人体姿态而非边界框来对齐区域,从而提高了分割精度。此外,框架还融合了人工骨架特征,以增强网络对重叠人体的区分能力。为了评估这一方法,作者引入了一个新的基准数据集OCHuman,它专注于严重遮挡的人体实例,并
2025-03-20 15:35:09
891
原创 【论文解读】Pose2Seg:无检测人体实例分割(附论文地址)
本文提出了一种基于人体姿态的实例分割框架,该框架不依赖于目标检测,而是直接基于人体姿态进行实例分割。该框架在处理遮挡情况下的人体实例分割问题上,比现有的基于检测的方法更准确。作者还引入了一个名为“Occluded Human (OCHuman)”的新基准数据集,专注于标注被遮挡的人体,包括边界框、人体姿态和实例掩码。引言研究背景与动机计算机视觉领域中与人类相关的研究日益增多,尤其是在多人姿态估计和人体实例分割方面。
2025-03-07 10:44:56
759
原创 【论文源码实战】YOLO+3D Bounding Box:实现对目标的3D框绘制
《3D Bounding Box Estimation Using Deep Learning and Geometry》展示了如何从单一视图中恢复已知对象类别的3D边界框。通过使用新颖的MultiBin损失进行方向预测和有效地选择边界框尺寸作为回归参数,该方法能够在没有额外的3D形状模型或复杂预处理管道的情况下估计稳定且准确的3D边界框。提出了未来的研究方向,包括将立体视觉和视频序列信息整合到方法中。
2025-01-08 13:36:57
592
原创 【YOLO 系列】基于YOLO的无人机垃圾分割检测系统【python源码+Pyqt5界面+数据集+训练代码】
随着无人机技术的发展和深度学习的进步,无人机在环境监测和垃圾管理中的应用越来越广泛。YOLO系列模型因其实时性和高精度在目标检测领域被广泛应用。本项目旨在开发一个基于YOLO的无人机垃圾分割检测系统,该系统能够利用无人机拍摄的图像进行垃圾的自动识别和分割,为城市环境管理和垃圾分类提供技术支持。通过使用YOLOv8模型,我们能够实现对无人机图像中垃圾目标的快速检测和精确分割,这对于提高垃圾处理效率和减少环境污染具有重要意义。
2025-01-02 23:21:16
918
原创 【论文解读】CVPR 2019 目标检测:CenterNet技术,以点代框,可扩展性强(附论文地址)
CenterNet是一个基于Anchor-free的目标检测算法,与单阶段目标检测算法yolov3相比,该算法在保证速度的前提下,精度提升了4个百分点。与其它的单阶段或者双阶段目标检测算法相比,该算法具有以下的优势:该算法去除低效复杂的Anchors操作,进一步提升了检测算法性能;该算法直接在heatmap图上面执行了过滤操作,去除了耗时的NMS后处理操作,进一步提升了整个算法的运行速度;。
2024-12-19 11:19:23
1298
原创 【YOLO 系列】基于YOLO的番茄成熟度检测检测系统【Python源码+数据集+训练代码】
在现代农业生产中,番茄成熟度的准确检测对于提高采摘效率、降低人工成本以及减少因成熟度判断失误造成的经济损失至关重要。传统的人工检测方法不仅效率低下,而且准确度和效率难以保证。随着深度学习技术的发展,特别是YOLO系列模型在实时图像识别和目标检测领域的卓越性能,我们开发了基于YOLO的番茄成熟度智能检测系统。该系统能够自动识别并分类不同成熟度阶段的番茄,为农业生产提供有力的技术支持。
2024-12-05 21:46:47
1274
原创 【论文解读】CVPR 2024 DSL-FIQA :全新人脸面部图像质量评估算法(附论文地址)
本文提出了一种基于Transformer的方法,用于评估面部图像的感知质量。方法包括两个独特机制:双集降解表示学习(DSL)和 Landmark-Guided Transformer。DSL机制使用合成和真实退化的面部图像来解耦退化和内容,提高对真实世界场景的泛化能力。提出了一个新的数据集CGFIQA-40k,包含40,000张图像,旨在克服现有数据集中的偏见,如肤色和性别表现的不平衡。通过广泛的分析和评估,展示了该方法的鲁棒性,并与先前的方法相比有显著改进。
2024-11-26 21:55:46
1712
原创 【YOLO 系列】基于YOLO的输电线路杆鸟巢检测系统【python源码+Pyqt5界面+数据集+训练代码】
输电线路的安全稳定运行对于电力供应至关重要。鸟巢作为外力因素之一,可能导致线路短路、跳闸等严重事故。传统的人工巡检方式效率低下,且难以及时发现和处理鸟巢问题。为了提高输电线路杆塔鸟巢的检测效率和准确性,我们开发了基于YOLO V8的智能检测系统。该系统利用深度学习技术,能够自动识别和定位输电线路杆塔上的鸟巢,极大地提升了检测的自动化水平和响应速度。
2024-11-21 21:12:24
964
原创 【论文源码实战】CRNN:基于图像序列识别的端到端可训练神经网络
CRNN模型,即卷积递归神经网络(Convolutional Recurrent Neural Network),是一种结合了卷积神经网络(CNN)和递归神经网络(RNN)优势的深度学习模型。CRNN模型专为处理图像中的序列识别任务而设计,尤其擅长于场景文本识别。
2024-11-19 09:51:06
1270
原创 【论文源码实战】NTS-Net模型:自监督机制实现细粒度分类
NTS-Net通过其创新的多代理合作学习方案,能够有效地解决了细粒度分类中的挑战,通过自监督机制自动定位图像中的信息区域,并利用这些区域的特征进行准确的分类预测。NTS-Net能够准确地识别出不同狗类的细微差异,如毛的颜色、形状和纹理等。在进行训练后,分类的准确率也很高,速度也不错。
2024-11-18 16:03:01
385
原创 【论文源码实战】EdgeYOLO: 边缘设备友好的无锚框检测器
EdgeYOLO是一个为边缘计算设备优化的实时目标检测器,它以较低的计算成本实现了高效率和高精度的目标检测,特别是在小目标识别方面表现出色。模型设计简洁,易于在边缘设备上部署,并且通过开源协作,支持社区进行进一步的改进和定制。此外,它还提供了不同规模的模型以适应不同的计算环境需求。关注公众号,回复:edgeyolo,即可获取edgeyolo相关代码、论文、预训练模型、使用方法示例等【论文源码实战】EdgeYOLO: 边缘设备友好的无锚框检测器硬性的标准其实限制不了无限可能的我们,所以啊!
2024-11-02 10:36:40
1175
原创 【论文解读】EdgeYOLO:一种边缘实时目标检测器(附论文地址)
这篇论文提出了一个基于最新YOLO框架的高效、低复杂度且无锚点的目标检测器,能够在边缘计算平台上实时实现。
2024-11-02 10:23:45
2076
原创 【YOLO 系列】基于YOLO的行人口罩检测系统【python源码+Pyqt5界面+数据集+训练代码】
在当前全球公共卫生形势下,戴口罩已成为预防呼吸道疾病传播的重要措施。然而,确保每个人都遵守这一规定仍然是一项挑战。为了提高公共场合的口罩佩戴合规性,我们开发了基于YOLO V8的行人口罩检测系统。该系统利用深度学习技术,能够自动识别和分类行人是否佩戴口罩,这对于监控和提醒公众遵守健康安全规定至关重要。
2024-10-31 21:19:36
1313
原创 【YOLO 系列】基于YOLO的工业自动化轴承缺陷检测系统【python源码+Pyqt5界面+数据集+训练代码】
轴承作为机械设备中的关键部件,其性能直接影响到设备的稳定性和寿命。轴承缺陷的早期检测对于预防设备故障、减少维护成本和提高生产效率至关重要。然而,传统的轴承缺陷检测方法往往依赖于人工检查,这不仅效率低下,而且容易受到主观因素的影响。为了提高轴承缺陷检测的准确性和效率,我们开发了基于YOLO V8的轴承缺陷智能检测系统。该系统利用深度学习技术,能够自动识别和分类轴承缺陷,即使在缺陷不明显或环境复杂的情况下也能保持高准确度。
2024-10-28 22:21:38
1708
1
原创 【YOLO 系列】基于 YOLO V8 的抽烟检测【python源码+Pyqt5界面+数据集+训练代码】
在公共场所实施禁烟政策是提高公共健康水平和维护良好社会环境的重要措施。然而,由于监管资源有限,传统的人工监管方式难以全面覆盖所有禁烟区域,导致禁烟政策执行难度大。为了加强公共场所的禁烟管理,我们启动了基于YOLO V8的抽烟行为智能检测系统项目。该项目利用深度学习技术,通过分析视频监控图像,自动识别并标记出抽烟行为,为管理人员提供实时的违规行为检测和反馈。
2024-10-01 17:20:43
1540
原创 【论文解读】ECCV2018细粒度分类:自监督机制NTS-Net模型引领新方向 (附论文地址)
这篇论文由北京大学机器感知国家重点实验室的Ze Yang、Tiange Luo、Dong Wang、Zhiqiang Hu、Jun Gao和Liwei Wang撰写,发表于2018年。论文提出了一种新颖的自监督机制,用于在没有边界框/部分注释的情况下有效定位图像中的信息性区域,以解决细粒度分类的挑战。
2024-09-28 10:29:54
1389
原创 【YOLO 系列】基于YOLO V8的野生动物检测与报警系统【python源码+Pyqt5界面+数据集+训练代码】
在自然环境和野生动物栖息地附近,人类活动日益频繁,这不仅对生态环境产生影响,也增加了与危险动物相遇的风险。为了提高人们对潜在危险的意识并采取预防措施,我们启动了基于YOLOV8的动物检测项目。该项目旨在通过先进的目标检测技术,实时识别和区分危险与非危险动物,从而提醒人们及时规避潜在威胁。
2024-09-17 14:51:53
1869
原创 【论文解读】图像序列识别:CRNN技术在场景文本识别中的应用与突破(附论文地址)
文章主要研究了基于图像的序列识别问题,特别是场景文本识别,这是基于图像的序列识别中最重要和最具挑战性的任务之一。
2024-09-10 18:56:16
1102
原创 【YOLO 系列】基于YOLOV8的智能花卉分类检测系统【python源码+Pyqt5界面+数据集+训练代码】
花朵作为自然界中的重要组成部分,不仅在生态学上具有重要意义,也在园艺、农业以及艺术领域中占有一席之地。随着图像识别技术的发展,自动化的花朵分类对于植物研究、生物多样性保护以及园艺爱好者来说变得越发重要。为了提高花朵分类的效率和准确性,我们启动了基于YOLO V8的花朵分类智能识别系统项目。该项目利用深度学习技术,通过分析花朵图像,自动识别并分类不同种类的花朵,为用户提供一个高效的花朵识别工具。
2024-09-07 21:10:08
1938
原创 2024年,人工智能行业哪些证书权威?
工信部电子标准院的人工智能从业人员认证证书是由工业和信息化部电子工业标准化研究院(以下简称“电子标准院”)颁发,旨在评价和认证人工智能领域专业人员的能力和技术水平。该证书基于电子标准院牵头研制的《人工智能从业人员能力要求》标准(SJ/T11805-2022),该标准于2022年7月1日由工业和信息化部发布实施,为人工智能专业人员的认证提供了权威依据。2024年9月20日-24日在北京举办。2024年9月20日-24日在上海举办。参加以上培训并通过考试的学员可获得。的人工智能从业人员(中级)认证证书。
2024-09-02 20:00:49
507
原创 【论文解读】SAM模型超级进化:面向移动端的轻量级SAM,比FastSAM快4倍!(附论文地址)
论文地址:这篇论文的标题是《FASTER SEGMENT ANYTHING: TOWARDS LIGHTWEIGHT SAM FOR MOBILE APPLICATIONS》,由Chaoning Zhang等人撰写,发表于2023年。文章主要探讨了如何将Segment Anything Model(SAM)优化,使其更适合移动设备应用。
2024-09-01 15:39:05
1058
原创 YOLO 单目测距:原理、方法与代码
单目测距的一个常见方法是假设物体的尺寸已知。通过测量物体在图像中的高度(或宽度),并结合物体的实际高度(或宽度),最简单的一种方式就是利用相似三角形的原理来计算物体的距离。
2024-08-26 22:05:47
1985
原创 【YOLO 系列】基于YOLO V8的多种类狗狗智能识别系统【python源码+Pyqt5界面+数据集+训练代码】
狗狗作为人类最忠实的伙伴,其种类繁多,特性各异。正确识别狗狗的种类不仅对于宠物爱好者和专业繁殖者具有重要意义,也对动物保护、宠物医疗、宠物服务等行业具有重要价值。为了解决这一问题,我们启动了基于YOLO V8的多种类狗狗智能识别系统项目。
2024-08-24 14:30:39
1299
原创 【YOLO 系列】基于YOLO V8的驾驶员实时疲劳驾驶检测识别系统【python源码+Pyqt5界面+数据集+训练代码】
随着汽车行业的蓬勃发展,驾驶员疲劳驾驶问题日益成为交通安全的一大隐患。疲劳驾驶不仅会降低驾驶员的反应能力,还可能引发严重的交通事故,对个人及社会造成不可估量的损失。尽管市场上已有多种疲劳检测技术,但它们在实时性、准确性以及环境适应性方面仍存在不足。为此,我们引入了YOLOV8这一先进的目标检测算法,结合驾驶员疲劳驾驶数据集,开发了一套创新的疲劳检测系统。
2024-08-17 12:12:53
3606
2
原创 YOLO V8-Segment 【单张图片推理】推理详解及部署实现
weights:模型权重文件的路径。默认为 "yolov8n.pt"。device (torch.device):运行模型的设备。默认为 CPU。dnn:使用 OpenCV DNN 模块进行 ONNX 推断。默认为假。data:包含类名的附加 data.yaml 文件的路径。可选。fp16:启用半精度推理。仅在特定后端支持。默认为 False。fuse:融合 Conv2D + BatchNorm 层进行优化。默认为 True。verbose:启用详细日志记录。默认为 True。
2024-07-16 17:06:34
1928
原创 YOLO V8-Pose 【批量图片推理】 推理详解及部署实现
在实际处理过程中,我们使用YOLO V8进行推理时,通常会针对一张图片进行推理。如果需要对多张图片进行推理,则可以通过一个循环来实现对图片逐张进行推理。单张图片推理时,需要注意图片的尺寸必须是32的倍数,否则可能导致推理失败。批量图片推理时,也需要注意图片的尺寸必须是32的倍数。需要注意的是,在批量推理时,虽然一次推理了多张图片,但实际处理方式仍然是通过循环进行的。在下面的文章中,我们将介绍如何使用更高效的方式进行批量推理,以获得更快的推理速度和更好的性能。
2024-07-10 19:12:49
1566
原创 YOLO V8-Pose 【单张图片推理】推理详解及部署实现
weights:模型权重文件的路径。默认为 "yolov8n.pt"。device (torch.device):运行模型的设备。默认为 CPU。dnn:使用 OpenCV DNN 模块进行 ONNX 推断。默认为假。data:包含类名的附加 data.yaml 文件的路径。可选。fp16:启用半精度推理。仅在特定后端支持。默认为 False。fuse:融合 Conv2D + BatchNorm 层进行优化。默认为 True。verbose:启用详细日志记录。默认为 True。
2024-07-02 21:56:26
1663
原创 【YOLO 系列】基于YOLO V8的密集场景下行人检测识别系统【python源码+Pyqt5界面+数据集+训练代码】
在密集的城市环境中,行人检测对于公共安全、交通管理和智能监控具有重要意义。然而,传统的行人检测方法在面对密集场景时,常常因目标重叠和遮挡而难以准确识别。为了应对这一挑战,我们启动了这个项目,目的是利用YOLOV8这一先进的深度学习技术,开发一个在密集场景下具有高准确度的行人检测系统。
2024-06-25 21:13:11
3179
原创 【YOLO 系列】基于YOLO V8的车载摄像头交通信号灯检测识别系统【python源码+Pyqt5界面+数据集+训练代码】
随着智能交通的发展,准确识别交通信号灯对提高道路安全和交通效率有重要的作用。传统的交通信号灯识别方法主要依靠传感器,存在安装成本高、维护困难等问题。为解决这些问题,我们利用YOLOV8技术,开发了基于车载摄像头的交通信号灯自动识别系统。
2024-06-23 15:20:35
1475
原创 【目标跟踪网络训练 Market-1501 数据集】DeepSort 训练自己的跟踪网络模型
Market-1501 数据集在清华大学校园中采集,夏天拍摄,在 2015 年构建并公开。它包括由6个摄像头(其中5个高清摄像头和1个低清摄像头)拍摄到的 1501 个行人、32668 个检测到的行人矩形框。每个行人至少由2个摄像头捕获到,并且在一个摄像头中可能具有多张图像。训练集有 751 人,包含 12,936 张图像,平均每个人有 17.2 张训练数据;测试集有 750 人,包含 19,732 张图像,平均每个人有 26.3 张测试数据。
2024-06-09 18:44:03
2489
4
原创 【YOLO 系列】基于YOLO V8的输电线路绝缘子缺陷检测识别系统【python源码+Pyqt5界面+数据集+训练代码】
在电力行业,输电线的维护和监控是确保电网稳定运行的关键。绝缘子作为输电线上的重要组成部分,其状态直接影响到电力传输的安全性和可靠性。然而,传统的人工巡检方法不仅耗时耗力,而且存在一定的安全隐患。为了提高输电线维护的效率和安全性,我们启动了这个项目,目的是利用YOLOV8这一先进的深度学习技术,开发一个自动化的输电线绝缘子状态监测系统。
2024-06-05 20:30:24
3062
原创 【YOLO 系列】基于YOLO V8的河道违规钓鱼检测识别系统【python源码+Pyqt5界面+数据集+训练代码】
随着社会发展和人口增长,对自然资源的保护和管理变得越来越重要。河流是重要的自然资源之一,然而,违规钓鱼等活动可能对河流生态环境造成严重破坏。本项目利用Yolov8算法,实现河道违规钓鱼检测,为水域资源保护和生态平衡的维护提供支持。
2024-06-03 20:08:40
1726
原创 深度学习模型的C++部署:ONNXRUNTIME引领跨平台革命
它不仅支持主流的CPU和GPU,还能在AMD、ARM等硬件上运行,为模型部署提供了极大的灵活性和兼容性。本文作为专注于计算机视觉领域的C++模型部署系列文章的开篇,揭示了C++与ONNXRUNTIME结合在计算机视觉任务中的强大潜力。它不仅提供了接近硬件层面的优化能力,而且通过精细的内存管理和多线程支持,实现了快速且高效的模型推理。:通过实际的计算机视觉项目,如实时目标检测系统,演示如何在C++中利用ONNXRUNTIME进行模型的加载和推理。:拥有庞大的库和框架支持,包括数学运算、图像处理、机器学习等。
2024-05-31 20:23:38
1623
原创 【YOLO 系列】基于YOLO V8的学生上课行为检测系统【python源码+Pyqt5界面+数据集+训练代码】
在现代教育环境中,学生上课行为的监测对于提升教学质量和学生学习效率具有重要意义。然而,传统的人工观察方法不仅效率低下,而且难以保证客观性和准确性。为了解决这一问题,我们启动了这个项目,目的是利用YOLOV8这一先进的深度学习技术,开发一个自动化的学生上课行为检测系统。
2024-05-27 20:47:18
9325
6
原创 YOLO V8-Detection 【批量图片推理】 推理详解及部署实现
在实际处理过程中,我们使用YOLO V8进行推理时,通常会针对一张图片进行推理。如果需要对多张图片进行推理,则可以通过一个循环来实现对图片逐张进行推理。单张图片推理时,需要注意图片的尺寸必须是32的倍数,否则可能导致推理失败。批量图片推理时,也需要注意图片的尺寸必须是32的倍数。需要注意的是,在批量推理时,虽然一次推理了多张图片,但实际处理方式仍然是通过循环进行的。在下面的文章中,我们将介绍如何使用更高效的方式进行批量推理,以获得更快的推理速度和更好的性能。
2024-05-22 19:39:35
5037
原创 【YOLO 系列】基于YOLO V8的PCB缺陷检测识别系统【python源码+Pyqt5界面+数据集+训练代码】
随着电子产品在各个领域的广泛应用,印刷电路板(PCB)作为电子设备的基础组件,其质量和可靠性变得至关重要。然而,由于制造过程中的复杂性和人为因素的介入,PCB常常会出现各种缺陷,如漏孔、老鼠咬痕、断路、短路、尖角和虚铜等问题。这些缺陷可能导致产品性能下降、故障甚至损坏,对产品质量和生产效率造成严重影响。为了提高PCB制造过程中的缺陷检测效率和准确性,我们展开了这个项目,旨在利用先进的深度学习技术构建一种自动化的PCB缺陷检测系统。
2024-05-19 15:20:30
3058
原创 【原理&代码详解】DeepSORT算法:多目标跟踪的深度学习解决方案
匈牙利算法是一种用于解决分配问题的有效算法。在DeepSORT算法中,匈牙利算法被用于解决数据关联问题,即如何将当前帧中检测到的目标(detections)与上一帧中跟踪的目标(tracks)进行匹配。DeepSORT通过计算检测框和跟踪框之间的相似度,构建一个代价矩阵,然后利用匈牙利算法找到最小化代价的匹配方案。初始化:当视频的第一帧被检测时,每个检测到的目标初始化一个跟踪轨迹。匹配。
2024-05-13 19:46:47
14573
4
YOLO V8 (Detection&Segment&Pose)batch & one.zip
2024-04-30
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人