- 博客(4785)
- 收藏
- 关注

原创 YOLOv5、YOLOv8、YOLOv10系列项目最全项目合集(已更新81个项目,持续更新中)
我们即将推出的YOLO系列专栏,涵盖YOLOv5、YOLOv8及YOLOv10的深度训练教程与PyQt界面开发实践,预计在2025年全面更新完毕。为了让更多开发者抢先体验,专栏将在2024年进行限时促销!2024年促销期间,专栏将推出限时优惠,抢先学习内容,享受专业指导,还可获得2025年更新后的全新版本!不要错过这次提升技能的绝佳机会,加入我们,一起开启智能视觉时代的新篇章。79元在目标检测领域,YOLO(You Only Look Once)系列模型凭借其速度与精度兼备的特性,成为许多项目中的首选方案。
2024-10-12 22:57:41
5027
原创 基于YOLOv11和LFW数据集的人脸支付验证系统实现
YOLOv11是最新改进的YOLO(You Only Look Once)系列目标检测算法,相比前代版本在精度和速度上都有显著提升。改进的骨干网络:采用更高效的CSPDarknet结构,增强特征提取能力自适应特征融合:引入BiFPN结构,实现多尺度特征的自适应融合动态标签分配:使用Task-Aligned Assigner进行更合理的正负样本分配损失函数优化:结合CIoU Loss和Focal Loss,提升检测精度。
2025-06-15 01:03:44
147
原创 商品破损检测系统:基于YOLOv11与自定义数据集的深度学习实现
python复制下载# 定义模型ch = self.yaml['ch'] = self.yaml.get('ch', ch) # 输入通道self.yaml['nc'] = nc # 覆盖YAML中的类别数self.yaml['anchors'] = round(anchors) # 覆盖YAML中的anchor# 构建模型self.model, self.save = parse_model(deepcopy(self.yaml), [] # 模型, 保存层。
2025-06-15 01:01:12
88
原创 基于YOLOv11的仓库机器人导航系统设计与实现:Amazon Robotics Challenge解决方案
本文将详细介绍一个基于YOLOv11目标检测算法的仓库机器人导航系统,该系统能够准确识别托盘(pallet)和箱子(box),为机器人提供精确的导航信息。而基于深度学习的视觉导航系统能够实时识别环境中的关键物体,如托盘和箱子,从而实现更智能的路径规划和货物搬运。YOLOv11作为YOLO系列的最新演进版本,在检测精度和速度上都有显著提升,非常适合仓储环境中的实时物体检测任务。YOLOv11在保持实时性的同时,提高了对小物体和密集物体的检测能力,这对仓储环境中的托盘和箱子检测尤为重要。
2025-06-15 01:00:32
165
原创 基于DeepFashion2数据集的服装检测系统:YOLOv11实现与UI界面开发
80万张高质量服装图片13个服装类别:短袖上衣、长袖上衣、短袖外套、长袖外套、背心、短裤、长裤、短裙、长裙、袜子、帽子、鞋、包包每张图片包含边界框、分割掩码、landmarks等标注多样化的场景:商业图片、街拍图片、消费者图片更高效的Backbone网络改进的特征金字塔网络(FPN)自适应训练样本分配策略更精确的损失函数以下是YOLOv11的模型定义:python复制下载# 模型参数self.nc = nc # 类别数。
2025-06-15 00:59:53
141
原创 基于YOLOv8的超市盗窃检测系统设计与实现
注意力机制:添加CBAM注意力模块小目标检测:增加小目标检测层时序建模:添加简单的LSTM层处理时序信息python复制下载nn.ReLU(),"""增强的C2f模块,添加CBAM注意力"""# 修改YOLOv8模型# 替换原有C2f模块# 使用改进后的模型。
2025-06-15 00:59:17
266
原创 基于YOLOv11的包裹分拣系统设计与实现:Pascal VOC数据集的应用
高精度:能够准确识别和定位各种包裹高效率:满足实时分拣的需求强适应性:能够处理不同尺寸、形状和颜色的包裹易部署:模型轻量化,适合在边缘设备上运行系统整体架构包括数据采集与标注、模型训练、性能优化和UI界面开发四个主要部分。Pascal VOC(Visual Object Classes)是计算机视觉领域广泛使用的数据集格式,它采用XML文件存储标注信息,包含以下关键元素:xml复制下载运行<size></size><object><bndbox></bndbox>
2025-06-15 00:56:54
125
原创 基于YOLOv11的零售场景顾客行为分析系统(Reaching/Stealing检测)
包含2000个标注视频片段,涵盖各种偷窃行为场景: 收集自多个超市的监控视频,包含伸手、取货、付款等行为: 我们自行采集的500小时零售监控数据,针对性地标注了可疑行为。
2025-06-15 00:56:07
291
原创 基于YOLOv11的条形码与QR码检测系统开发实战
条形码是一种将宽度不等的多个黑条和空白按一定编码规则排列的图形标识符,用于表示商品信息。QR码则是二维条码的一种,能够存储更多信息且具备快速读取能力。
2025-06-15 00:55:19
295
原创 基于YOLOv11的零售自助结账检测系统设计与实现——RPC数据集应用
针对零售场景优化的数据增强策略改进的YOLOv11网络结构多模态特征融合机制基于Streamlit的可视化管理系统TensorRT加速的边缘部署方案。
2025-06-15 00:53:03
226
原创 货架商品检测系统:基于YOLOv11的超市商品识别解决方案
Grocery Store Dataset是一个专门为零售商品检测设计的公开数据集,包含超过5000张超市货架的高分辨率图像,涵盖了80多种常见商品类别。每张图像都经过专业标注,包含商品的边界框和类别信息。图像分辨率:平均1920×1080像素标注格式:PASCAL VOC格式类别数量:82种常见超市商品数据量:训练集4200张,测试集800张。
2025-06-15 00:51:36
123
原创 基于YOLOv11和卫星图像的土壤侵蚀检测系统:从数据准备到Web部署
数据收集使用Sentinel-2 (10m分辨率)或Landsat (30m分辨率)卫星数据通过Google Earth Engine或Copernicus Open Access Hub获取标注工具python复制下载# 使用LabelImg进行标注的示例命令数据增强python复制下载Backbone增强引入CSPNeXt模块添加注意力机制深度可分离卷积优化Neck改进双向特征金字塔网络(BiFPN)自适应特征融合Head优化解耦头设计动态标签分配。
2025-06-15 00:50:49
441
原创 基于YOLOv11的海洋垃圾检测系统设计与实现——J-EMODNet数据集应用
本文将详细介绍基于YOLOv11算法和J-EMODNet数据集的海洋垃圾检测系统开发过程,包括数据处理、模型训练、性能优化以及可视化界面开发等完整流程。我们将提供完整的代码实现,帮助读者理解并复现这一系统。超过10,000张标注图像覆盖不同海域、光照条件和深度7种主要垃圾类别:塑料瓶、塑料袋、渔网、金属罐、玻璃瓶、纸制品、其他塑料标注格式包括COCO和PASCAL VOC。
2025-06-15 00:48:52
247
原创 基于YOLOv11的鸟类保护监测系统设计与实现:CUB-200数据集应用
类别数图像数训练集测试集标注信息20011,7885,9945,794边界框、15个关键点、312个属性数据特点:每类约60张图像图像分辨率不等(平均500×500像素)鸟类边界框15个关键点(眼、喙、翅膀等)312个视觉属性(颜色、纹理等)
2025-06-15 00:48:10
465
原创 基于YOLOv11的森林火灾预警系统开发与应用
包含无人机在真实森林环境中采集的火灾图像和视频超过15,000张高分辨率图像 (1920×1080)精细标注的火焰和烟雾边界框涵盖不同光照条件(白天/夜晚)和火灾发展阶段包含正样本(火灾)和负样本(类似火灾的其他现象)数据集结构示例:text复制下载FLAME/│ └── val/│ └── ...├── train/│ └── ...└── val/└── ...
2025-06-15 00:45:21
215
原创 基于YOLOv11的无人机农田监测系统设计与实现
AgriVision是当前最大的无人机农田监测公开数据集,由瓦赫宁根大学与微软研究院联合发布。图像数量:3,712张高分辨率无人机图像(平均4000×3000像素)目标类别:5大类(作物、杂草、设备、人员、障碍物),20小类标注信息:边界框标注,部分图像包含语义分割标注采集条件:不同季节、天气、光照条件下的农田场景地理分布:覆盖欧洲和北美的7个主要农业区。
2025-06-15 00:44:36
259
原创 基于YOLOv11的牲畜计数系统设计与实现:COWC数据集应用
数据筛选选择包含类似牲畜分布特点的图像重点关注中等密度和小目标场景标注转换将车辆标注转换为牲畜标注添加牛羊类别区分数据增强添加合成牲畜到真实场景中使用风格迁移增加数据多样性。
2025-06-15 00:42:49
235
原创 基于YOLOv11的农田杂草检测系统设计与实现(CropWeed数据集)
CropWeed数据集是农业领域常用的杂草检测基准数据集,包含多种作物和杂草的高分辨率图像。图像数量:约5,000张田间场景图像类别:作物(如甜菜、玉米)和杂草(如藜草、荠菜)标注格式:PASCAL VOC格式的边界框标注挑战:光照变化、遮挡、尺度变化等。
2025-06-15 00:42:00
300
原创 基于YOLOv11的水果成熟度检测系统开发与应用
131种不同水果和蔬菜的高分辨率图像超过90,000张图像每个水果在不同成熟阶段的多角度拍摄统一白色背景,便于模型学习特征图像尺寸100x100像素到258x258像素不等该数据集非常适合用于水果分类和成熟度检测任务,已被广泛应用于相关研究。
2025-06-15 00:37:42
165
原创 基于YOLOv11的作物病害检测系统设计与实现
PlantVillage数据集是植物病害识别领域最著名的公开数据集之一,包含超过54,000张健康和有病害的植物叶片图像,涵盖14种作物和26种病害。该数据集由宾夕法尼亚州立大学和瑞士联邦理工学院的研究团队共同创建。图像数量:54,305张作物种类:14种(苹果、蓝莓、樱桃、葡萄等)病害类别:26种图像格式:彩色RGB,分辨率不一采集条件:白色背景,实验室环境骨干网络优化:采用更高效的CSPNet结构,减少计算量同时保持特征提取能力特征金字塔增强。
2025-06-15 00:37:04
337
原创 基于YOLOv11的害虫检测系统设计与实现:IP102数据集应用
图像数量:75,222张类别数量:102类图像分辨率:从640x480到1920x1080不等标注格式:PASCAL VOC格式的XML文件类别分布:长尾分布,部分类别样本较少水稻害虫:如褐飞虱、白背飞虱小麦害虫:如麦蚜、麦蜘蛛蔬菜害虫:如菜青虫、小菜蛾果树害虫:如柑橘红蜘蛛、梨小食心虫。
2025-06-15 00:36:29
171
原创 基于多摄像头和YOLOv11的老年人跌倒监测系统设计与实现
24个不同场景:包括客厅、卧室、走廊等常见跌倒场景8种活动类型:行走、坐下、站立、弯腰、跌倒等4个同步摄像头:提供多角度视角(俯视、平视等)30名参与者:年龄分布20-42岁(可模拟老年人动作)总计320个视频片段:每个场景约30秒,帧率25fps数据集目录结构如下:text复制下载└── ...
2025-06-14 01:00:17
56
原创 基于YOLOv11的手势控制轮椅系统:从数据集构建到实时部署
python复制下载# 数据采集与标注工具实现import cv2import os# 定义控制手势类别0: "stop","""采集每个手势的样本"""print("开始数据采集,按1-7切换手势类别,空格键保存样本,q退出")break# 显示当前手势类别# 切换手势类别# 保存样本# 记录标注信息(实际应用中需手动或自动标注边界框)"bbox": [] # 需要后续标注})
2025-06-14 00:58:39
183
原创 基于YOLOv11的口罩佩戴合规检测系统:Custom Datasets实战
正确佩戴口罩(proper_mask)不正确佩戴口罩(incorrect_mask)未佩戴口罩(no_mask)多角度人脸图像不同光照条件下的样本多种口罩类型(医用外科口罩、N95口罩等)不同背景环境(室内、室外等)pythonimport osimport cv2"""处理原始数据集并分割训练集/测试集"""# 收集所有图像和标注文件# 数据集分割# 处理训练集# 处理验证集# 创建数据集配置文件"""处理单个图像和标注文件"""# 解析XML标注。
2025-06-14 00:51:02
268
原创 基于YOLOv11的内窥镜息肉检测系统:从Kvasir-SEG数据集到UI界面实现
早期癌症筛查:约80%的结直肠癌由腺瘤性息肉发展而来减少漏诊率:人工检查的息肉漏诊率高达22-28%提高检查效率:辅助医生快速定位可疑病变区域标准化评估:减少不同医生之间的诊断差异Kvasir-SEG是由挪威Simula研究实验室发布的公开内窥镜图像数据集,专门用于息肉分割和检测研究。1000张高分辨率图像:来自真实的内窥镜检查,涵盖各种息肉形态像素级标注:每张图像都有精确的息肉边界标注多样性:包含不同大小、形状、位置和纹理的息肉挑战性案例:包含模糊、光照不均和遮挡等复杂情况。
2025-06-14 00:49:40
68
原创 基于YOLOv11的牙齿缺陷检测系统:从数据集构建到UI界面实现
构建高质量的牙齿缺陷检测系统首先需要一个标注良好的数据集。:包含多种牙齿状况的图像,可用于龋齿检测:专门针对龋齿检测的数据集:包含口腔癌和龋齿图像由于公开数据集数量有限,在实际应用中,我们通常需要与牙科诊所合作收集自己的数据集。YOLOv11是YOLO系列的最新演进版本,在速度和精度之间取得了更好的平衡。骨干网络优化:采用更高效的CSPDarknet结构特征金字塔增强:改进的PANet结构实现更好的多尺度特征融合检测头改进:解耦的分类和回归头损失函数优化:使用更有效的CIoU损失python。
2025-06-14 00:46:16
342
原创 基于YOLOv11的手术器械识别系统设计与实现(Cholec80数据集)
Cholec80数据集由80段腹腔镜胆囊切除手术视频组成,每段视频时长约1小时,帧率为25fps。手术阶段标注(7个阶段)手术器械存在标注(7种器械)器械边界框标注(本文主要使用)Grasper(抓钳)Bipolar(双极电凝钳)Hook(电钩)Scissors(剪刀)Clipper(夹钳)Irrigator(冲洗器)SpecimenBag(标本袋)
2025-06-14 00:45:38
278
原创 基于YOLOv11的皮肤病检测系统:ISIC Archive数据集实战
ISIC(International Skin Imaging Collaboration) Archive是一个大型的公开皮肤病图像数据集,专门用于皮肤病变分析研究。该数据集包含多种皮肤病变类型的图像,特别是黑色素瘤、基底细胞癌和良性病变等。高分辨率临床图像(通常为1024×1024或更大)多种病变类型的专业标注包含患者元数据(年龄、性别、病变部位等)持续更新和扩展更高效的骨干网络:使用改进的CSPDarknet结构,增强了特征提取能力自适应特征融合:动态调整不同尺度的特征图权重。
2025-06-14 00:45:05
115
原创 基于YOLOv11的细胞检测系统:从BBBC数据集到UI界面实现
细胞检测是定量细胞生物学研究的基础步骤,其主要目标是在显微镜图像中准确定位和分类细胞。药物筛选:评估化合物对细胞形态和数量的影响疾病诊断:通过细胞形态学变化检测病理状态基础研究:研究细胞周期、细胞分裂和细胞间相互作用Broad Bioimage Benchmark Collection (BBBC)是由哈佛大学和麻省理工学院Broad研究所维护的公开生物图像数据集。BBBC005: 包含人工合成的细胞图像,用于验证细胞计数算法BBBC006: 包含经过不同化合物处理的U2OS细胞图像。
2025-06-14 00:44:35
250
原创 X光物体检测(Foreign Object Detection)——基于NIH Chest X-ray Dataset的YOLOv11深度学习实现及UI界面设计
医学影像目标检测聚焦于准确定位病灶或异物区域,常用方法包括传统机器学习和深度学习。深度学习通过自动学习特征,极大提升了检测的精度和效率。NIH Chest X-ray Dataset是由美国国立卫生研究院发布的大规模胸部X光数据集,包含112,120张图像,覆盖14种胸部疾病。虽然数据集中不专门标注异物,但可以基于附加标注或者进行二次标注处理,创建异物检测任务的数据集。本项目展示了基于NIH Chest X-ray数据集,使用YOLOv11进行异物检测的完整流程,并实现了便捷的图形界面。
2025-06-14 00:38:37
154
原创 医疗工具检测 (Scalpel, Syringe) - 基于Surgical Tools Dataset的YOLOv11目标检测与UI界面实现
随着医疗设备和手术操作的日益智能化,自动识别和定位手术中使用的医疗工具成为智能手术辅助系统的重要组成部分。特别是在微创手术和机器人辅助手术中,实时准确检测手术刀(scalpel)、注射器(syringe)等关键工具,不仅能辅助医生提高手术安全性,还能用于手术流程监控和术后质量管理。目标检测是计算机视觉领域的关键任务,目标是识别图像中目标的类别及其位置。近年来,深度学习极大提升了目标检测性能,特别是单阶段检测器如YOLO系列因其检测速度快、精度高而被广泛应用。
2025-06-14 00:37:48
456
原创 道路施工检测 (construction) - 基于Mapillary Vistas数据集的YOLOv11目标检测及UI界面实现
目标检测是计算机视觉的重要任务,目标是识别图像中的目标物体类别及其位置(用边界框表示)。两阶段检测器:如Faster R-CNN,准确度高但速度较慢单阶段检测器:如YOLO系列、SSD,速度快且精度相对较好,适合实时场景数据量:约25,000张高分辨率街景图标注类型:语义分割、实例分割、多类别检测类别示例:construction, road, car, person, traffic sign等格式:COCO风格JSON标注。
2025-06-14 00:37:03
376
原创 紧急车辆检测(ambulance, police car)——基于自定义数据集的YOLOv11实现与UI界面设计
目标检测是计算机视觉中的基础任务,目的是在图像中定位并识别目标物体。基于区域提议的方法:如R-CNN系列。单阶段检测方法:如SSD、YOLO系列。YOLO(You Only Look Once)系列由于其速度快、准确度高,受到广泛关注,适合实时检测。由于COCO、Pascal VOC等通用数据集对紧急车辆类别支持有限,我们需要自定义数据集。LabelImg:支持YOLO格式导出,操作简单。LabelMe:支持多种格式,灵活。Roboflow(在线标注和管理)。
2025-06-14 00:36:19
243
原创 自行车/摩托车检测 (bicycle, motorcycle) — 基于 COCO 数据集的 YOLOv11+UI界面实现
COCO(Common Objects in Context)是一个广泛使用的目标检测、分割和关键点检测数据集。它包含80类物体,其中自行车(bicycle,类别ID:1)和摩托车(motorcycle,类别ID:4)是其中两个交通工具类别。COCO训练集包含约11.8万张图片,丰富多样的场景,适合训练通用目标检测模型。COCO注释包含精确的边界框和类别标签,适合监督式目标检测。我们将基于COCO数据,筛选自行车和摩托车样本,训练专门的检测模型。
2025-06-14 00:35:17
701
原创 道路坑洼检测系统设计与实现 —— 基于YOLOv11与UI界面的深度学习项目
该数据集包含数千张道路坑洼图片,图像涵盖不同光照、天气、道路类型。数据集标注了坑洼的准确边界框,支持目标检测模型训练。数据集来源(示例链接)数据量:约5000张标注图像标注格式:YOLO格式(类别ID、中心点x、中心点y、宽度、高度)类别数:单类别(pothole)Backbone:轻量级的CSPDarknet,特征提取高效。Neck:PANet结构用于增强多尺度特征融合。Head:预测层包括分类和定位,改进的锚框机制提升小目标检测效果。优化。
2025-06-14 00:34:27
118
原创 驾驶员行为检测(Drinking, Phone Use)——基于StateFarm Distracted Driver Dataset与YOLOv11的深度学习实战
StateFarm公开了一个驾驶员分心行为数据集,用于竞赛和研究。该数据集包含驾驶员在多种分心状态下的图片,适合用作行为分类和检测任务。数据集链接类别:共10个驾驶状态(包括安全驾驶、打电话、调音响、喝饮料、抽烟等)样本数:超过22,000张图像图像分辨率:约640x480像素标注形式:图片与对应行为标签饮酒(drinking)使用手机(phone use,包括打电话左、打电话右、发送短信左、发送短信右)为了利用YOLO进行检测,需要对数据集做目标检测标注,将行为对应到驾驶员动作的框中。
2025-06-14 00:33:41
349
原创 红绿灯状态检测 (TrafficLightStateDetection) —— 基于LISA Traffic Light Dataset,YOLOv11与UI界面实战指南
包含多种天气、时间段(白天、黄昏、夜晚)标注细致,包含信号灯位置及状态(红灯、黄灯、绿灯、闪烁等)数据量适中,适合训练和测试交通信号灯检测模型高效的多尺度特征提取能力优秀的小目标检测性能,适合红绿灯这类小尺寸目标快速推理,适配实时检测需求。
2025-06-14 00:32:38
136
原创 道路障碍物检测 (ObstacleDetection) —— 基于KITTI与NuScenes数据集,YOLOv11+UI界面完整实战指南
来源:卡尔斯鲁厄理工学院和丰田技术研究院合作内容:多传感器采集数据,包括立体相机、激光雷达、GPS/IMU类别:汽车、行人、骑车人、障碍物特点:高质量标注,广泛用于自动驾驶感知算法评测YOLOv11是YOLO系列最新版本,结合了Transformer和注意力机制,具有更强的特征提取和多尺度检测能力,特别适合障碍物检测中多样、大小不一的目标。速度快,适合实时应用准确率高,特别是小目标检测提升明显支持端到端训练和推理,集成方便。
2025-06-14 00:32:06
298
原创 车辆盲区检测(Blind Spot Detection)系统设计与实现——基于BDD100K数据集与YOLOv11模型
车辆盲区是指驾驶员无法直接通过后视镜或侧视镜观察到的区域。这些区域通常是车辆两侧、后方与后角落的死角,常见于大型车辆、货车或多车道高速公路行驶时。BDD100K是由伯克利AI研究中心发布的大规模自动驾驶场景数据集,涵盖了多种天气、时间、场景和多样车辆类型,标注丰富且公开使用。
2025-06-14 00:31:25
265
原创 行人过街检测(Pedestrian Crossing Detection)基于JAAD数据集与YOLOv11的深度学习实现
JAAD(Joint Attention for Autonomous Driving)数据集是针对自动驾驶中行人行为分析而设计的公开数据集。行人是否在过街行人注视车辆的行为交通环境及信号灯状态行人动作特征数据量大:含数千段视频及标注行为细粒度标注:可用于检测是否过街、等待、停留等状态多样性高:涵盖不同天气、光照、道路环境数据集下载链接YOLO(You Only Look Once)系列算法是实时目标检测领域的经典模型,以其高速度和良好准确率闻名。
2025-06-14 00:30:29
287
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人