- 博客(13)
- 收藏
- 关注
原创 YOLOv5中imgsz设置与使用
在训练过程中,较大的输入尺寸会使每个训练批次的计算量增大,可能导致训练时间更长、显存使用更多,但不会改变网络的结构。训练和推理时使用相同的 `imgsz` 是理想的做法,能够保证一致的结果,避免因输入尺寸变化带来的性能差异。如果需要在推理时使用不同的尺寸,YOLOv5 仍然可以正常工作,但可能会出现精度略有下降的情况。更大的输入尺寸(如 1280x1280)会增加推理时的计算量和内存消耗,但不会改变模型的参数量。推理时,如果使用与训练时不同的尺寸,YOLOv5 会重新缩放图像,但可能会导致推理精度的变化。
2025-02-26 16:11:38
793
原创 目标检测中ap(平均精度),它和平均有什么关系?明明就是横坐标使用的recall,纵坐标是用的precision组成的曲线下面的面积,和平均一点关系也没有啊?
在目标检测中,确实有些混淆,尤其是在这个名字的由来上。让我们深入探讨这个问题。
2025-01-26 15:45:41
356
原创 基于yolov8和pyqt5的吸烟行为检测,源码+pyqt5界面+模型和数据集,免环境安装,一键启动
基于YOLOv8和PyQt5的吸烟行为检测软件通过深度学习与现代化UI设计的结合,显著提高了吸烟行为检测的自动化与智能化水平。通过该系统,可以快速检测图片、视频或实时摄像头画面中的吸烟行为,并展示相关的检测信息,具有广泛的实际应用价值。基于yolov8和pyqt5的吸烟行为检测,免环境安装,一键启动,图形化界面+训练好的模型+带标签的数据集(3600张图片)+设计说明文档。视觉模型使用的yolov8,图形界面使用的pyqt5,模型经过300轮的训练map@0.5达到0.911.#计算并记录消耗时间。
2025-01-19 13:29:32
788
原创 yolov3,yolov5,yolov7,yolov8,yolo11免环境安装一键训练工具------训练自己的数据集
如果你没有划分数据集,你只需要选择包含了图片和标签(xml或者txt格式)文件夹的父文件夹,程序将自动转化格式并划分数据集------图片和标签文件可以混在一起也可分开放。1.一键训练yolo系列模型,免安装,免环境配置,支持cpu和gpu训练,gpu必须是nvidia卡。olov3,yolov5,yolov7,yolov8,yolo11免环境安装一键训练自己的数据集。3.支持voc格式的xml标签,和yolo的txt格式标签..如果你已经像以下格式划分好了yolo格式的数据集.
2025-01-14 12:03:38
423
原创 目标检测中非极大抑制在评估过程和损失函数中的作用
评估过程中的NMS:主要用于消除重复的预测框,确保每个目标只有一个预测框被计算,以便准确评估模型的性能(如计算 mAP)。训练过程中的NMS:虽然NMS不是直接用于损失函数的计算,但它可以间接帮助正负样本的选择,减少冗余框的干扰,确保模型只关注最重要的预测框。所以,NMS在评估过程中直接应用,用于去除冗余框,而在训练过程中,它通常作为一种工具,帮助选择有效的样本,但不会直接影响损失函数的计算。
2024-11-06 10:49:43
457
原创 目标检测中IoU阈值和置信度阈值的区别和作用
低置信度的框虽然在推理过程中可能会被筛选掉(如果设置了高置信度阈值),但在评估过程中,它们仍然会被计算进来,只要它们的 IoU 足够高(大于或等于 IoU 阈值)。在评估中使用较低的置信度阈值可能会导致更多的错误预测参与计算,从而影响最终的性能指标(如 mAP)。IoU阈值影响的是目标检测模型如何进行正负样本的区分和位置损失的计算。通常它决定了预测框与真实框是否足够接近,影响位置精度的计算。置信度阈值影响的是目标存在性损失。
2024-11-06 10:27:26
3020
原创 神经网络中的逻辑门
神经网络中的逻辑门是指通过神经元和激活函数组合实现基本逻辑操作(如与、或、非等)的结构。尽管神经网络通常不显式使用逻辑门,但它们的内部机制可以模拟这些逻辑操作。以下是对基本逻辑门的解释以及如何在神经网络中实现它们:与门输出为1(真)仅当所有输入均为1时。可以通过设置一个神经元的权重和偏置来实现与门。2. 或门(OR Gate)或门输出为1(真)只要至少有一个输入为1。可以用权重和偏置来实现。非门的输出是输入的反转。如果输入为1,输出为0;输入为0,输出为1。 异或门输出为1当且仅当输入
2024-10-28 13:37:35
1129
原创 基于YOLOv8的“道路缺陷检测识别系统“,python源码+Pyqt5界面
基于 PyQt 和 YOLOv8 开发的"道路缺陷检测识别系统"为道路维护和检测提供了一种高效、便捷的解决方案。它不仅能够实时检测和识别道路上的缺陷,还可以生成详细的报告,为道路的修复与维护提供重要参考。凭借其强大的检测能力和灵活的界面设计,该系统能够在城市道路管理、交通安全保障等多个领域发挥重要作用。在未来的发展中,系统还可以进一步优化和扩展,例如通过引入更多的深度学习模型和检测算法,提升检测精度,或者与无人机等设备结合,实现更加智能化的道路监控与维护。
2024-10-24 14:27:34
1336
原创 通过C++的类模版定义的对象,对象所占用的内存空间大小,是在编译期就确定了,还是在运行的时候确定的
通过C++的类模板定义的对象,其对象所占用的内存空间大小是在编译期确定的,而不是在运行时。类模板在编译时会被实例化,编译器会根据模板参数具体化出相应的类。在编译过程中,编译器就能确定模板类的每个实例所需的内存大小。因此,模板实例对象的大小是静态的,编译时就可以确定。T data;// 使用int类型实例化// 使用double类型实例化在这个例子中,和是两个不同的类型,分别根据int和double来实例化。因为int和double类型的大小在编译时是已知的,因此obj1和obj2。
2024-10-12 12:03:25
997
原创 机器学习中求损失函数最化小的时候,是求使所有样本最小化的权重参数吗
SGD不追求每个样本的最小损失,而是通过对每个样本进行多次更新来近似所有样本的平均损失最小化。每个样本的最小损失权重参数可能不同,但训练的目标是找到全局的权重,使得整个训练集上的损失函数最小化,而不是为每个样本单独找到最优解。通过大量样本的随机更新,SGD会逼近全体样本的最优解,虽然单个样本的局部最优解可能不同,但整体会收敛到全局最优。每次的权重更新是局部的,基于当前样本的损失最小化,但由于不同样本的连续参与,梯度更新方向逐渐会平均化。通过多个样本的不断训练。
2024-10-11 14:26:39
595
1
原创 既然三层神经网络可以模拟任何函数,那为什么不同的任务还要设计出各种网络结构呢?
设计一个能够自动生成网络结构的神经网络模型是可行的,**神经架构搜索(NAS)**技术正是这样一种方法,它使得模型可以为特定任务设计出最优的网络结构,而不需要人为干预。这种自动化设计方法不仅节省了大量的人工设计时间,还能生成更高效、更精简的模型结构,从而提升性能并减少计算资源的消耗。
2024-10-11 13:08:54
624
原创 yolov5训练自己的(自定义)数据集
然后点开始菜单中的Anaconda Powershell Prompt启动anacoda。第一步下载anaconda配置python的虚拟环境。下载完以后,选择安装路径,点下一步,一下步完成安装。运行以下命令更改数据源为国内源。
2024-10-11 13:02:48
791
3
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人