- 博客(23)
- 收藏
- 关注
原创 U-shape_Transformer_for_Underwater_Image_Enhancement的复现
输出为true的话,那就说明安装为GPU的版本啦,然后在安装requirements的时候,发现torch被重新安装了,于是删掉requirements里的torch和torchvision,然后就只能重新再来,最终运行test就可以啦。然后他的运行、测试都需要jupyter notebook,但我不是专业版本的,然后查了半天也没搞清楚怎么弄,后来就把这个代码直接复制粘贴到py文件里。因为我是直接测试,而不是使用,因此,我选择训练,提前下载好预训练模型,作者在代码中提供放入saved_models。
2025-04-07 11:40:49
33
原创 DEYOLO和YOLO-MS
这篇文章主要融合RGB图像和红外图像,RGB图像提供丰富的纹理、颜色等细节信息,但易受到天气影响。红外图像不受天气影响能显示出场景中的热分布问题。为了提高在光照下的检测能力,将两者的优点进行结合,提高检测效果。作者主要在YOLO的基础上,创建了3个新的模块。1.DECA(a dual semantic enhancing channel weight assignment module),通过给通道赋予不同的权重,得到重要的通道,与另一种模态进行相乘,获得另一种模态的语义和纹理信息。
2025-03-31 16:15:41
731
原创 YOLOv12代码运行
打开requirements,显示torch 2.2.2 所以我的pytorch是2.2.2。4.因为是Windows系统,需要下载:windows版FlashAttention。安装完成后,安装flash_attn,后面的名字按照自己的修改。5.开发环境中安装 Python 包的命令,用于开发和调试阶段。3.安装requirements,注释掉第三行。剩下就可以在准备自己的数据集开始训练啦。cuda版本,打开cmd,命令行输入。下载后放在YOLOv12的根目录下。python我安装的是3.11。
2025-03-17 15:35:57
277
原创 9月论文学习
Alexandria Engineering Journal 影响因子6.2摘要:为了应对水下环境的挑战,提出了MarineYOLO network。首先,将传统的C2f模块转变为EC2f模块,同时将模块引入到yolov8。此外,被引入,进一步细化了Feature Pyramid Network(FPN),增强小目标的特征提取。Wise-IoU替换了传统的CIoU,提高目标定位的精度和稳定性。在RUOD数据集上,AP值达到78.5%,URPC为88.1%。
2025-03-13 15:52:08
1277
原创 Debug:RuntimeError: expected scalar type Half but found Float
然后在linear,115行左右,这个改不改无所谓 主要是网络配置结构有问题。然后仔细看了一下输出的网络结构,发现网络结构配置文件有问题。
2024-09-18 17:40:50
298
1
原创 yolov5代码
在train.py文件,在前面的地方,加入os.environ["GIT_PYTHON_REFRESH"] = "quiet"在我下载的yolov5的代码里,我并没有看见import os。
2024-09-04 14:58:17
1105
原创 论文学习哇
在本文中,我们提出了一种新的目标检测模型YOLOX-ViT,并研究了知识蒸馏在不牺牲性能的情况下减少模型尺寸的有效性。我们的研究集中于水下机器人技术,解决了关于较小模型的可行性和YOLOX中视觉变压器层的影响的关键问题。此外,我们引入了一个新的侧扫描声纳图像数据集,并使用它来评估我们的目标探测器的性能。结果表明,知识蒸馏能有效地降低壁检测的误报。此外,引入的视觉变压器层显著提高了在水下环境中的目标检测精度。
2024-08-27 09:41:21
1025
原创 Yolov8网络结构学习
首先,使用1x1卷积核将输入通道数减少到原来的1/2,以减少计算量和内存消耗。yolov5中的C3模块在yolov8中被替换为了C2f,C2f则采用了yolov7中ELAN 多层堆叠的结构,增加了更多类似resnet残差块中的跳跃连接,丰富了模型的梯度流。在C2f模块中用到的DarknetBottleneck模块,使用多个3x3卷积核进行卷积操作,提取特征信息,同时其具有add是否进行残差链接的选项。与yolov5一样,每个卷积层的模块都采用步长为2的卷积核进行降采样操作,减少特征图的尺寸同时增加通道数。
2024-07-17 21:41:43
1584
原创 YOLOv7网络结构学习
backbone的基本组件就介绍完了,我们整体来看下 backbone,经过 4 个 CBS 后,接入例如一个 ELAN ,然后后面就是三个 MP1 + ELAN 的输出,对应的就是 C3/C4/C5 的输出,大小分别为 80 * 80 * 512 , 40 * 40 * 1024, 20 * 20 * 1024。每一个 MP 由 5 层, ELAN 有 8 层, 所以整个 backbone 的层数为 4 + 8 + 13 * 3 = 51 层, 从 0 开始的话,最后一层就是第 50 层。
2024-07-17 11:24:22
4280
原创 YOLOv6网络结构学习
学习yolov6之前,可以先了解一下RepVGG推理是基于已训练好的模型或知识库,对新的或未知数据进行预测、分类或决策的过程。它的目的是应用已学到的知识和能力来解决实际问题。相比之下,训练是通过给定的数据集和算法调整模型参数,使模型能够从数据中学习并捕获有用的特征和规律。训练的目的是使模型在特定任务上达到较高的性能。
2024-07-15 07:42:44
561
原创 yolo5s代码学习
x[i] = x[i].view(bs, self.na, self.no, ny, nx).permute(0, 1, 3, 4, 2).contiguous() # 确保张量是连续的定于forward,并接受参数xz=[] 推断时的输出z = []对输入x调整形状:bs na nx ny no nx,ny代表网格的大小 [1,3,32,32,85]
2024-07-05 19:59:28
1048
原创 YOLOv5理论学习
3.Warmup and Cosine LR scheduler:在训练的初期,将lr从一个非常小的值慢慢增长到所设置的初始学习率;两个5*5的池化相当于一个9*9的池化,三个5*5的池化相当于一个13*13的池化,虽然二者的计算结果一样,但是两个5*5、三个5*5更快。之前没有对高和宽进行限制,会出现梯度爆炸、训练不稳定等问题,修改之后,倍率因子变成了0-4之间,分类损失、目标损失、定位损失,针对不同的尺度,权重也不一样,倍数太大,岂不是和大的锚框重复了?那针对自己的数据集,是不是可以更改权重。
2024-07-03 10:28:30
594
原创 YOLOv4理论学习
2020 CVPR:SPP、PAN:YOLOv3优化策略:Eliminate grid sensitivity、Mosaic data augmentation、IoU threshold(match posotive samples)、Optimizered Anchors、CIOU。
2024-07-01 22:10:25
573
原创 YOLOv3 SPP
Mosaic图像增强是一种数据增强技术,通过将四张不同的图片拼接在一起,增加数据集的多样性和目标个数,从而丰富图片的背景信息。优点:增加数据的多样性、增加目标个数、BN能一次性统计多张图片的参数。
2024-06-28 18:33:27
888
原创 YOLOv3网络结构配置文件
它使得任意大小的特征图都能够转换成固定大小的特征向量,其核心思想:把经典的金字塔池化结构Spatial Pyramid Pooling引入CNN中,从而使CNN可以处理任意尺寸的图片。为了解决ReLU在 x<0 时梯度消失引起的学习不安定问题,提出了Leaky ReLU, 使得在 x<0 时也能让学习继续进行,便于让模型更具活性。ReLU函数在x<0时,函数值恒为0,且其导函数也为0,导致如果神经元的输出一旦变为0后,就再也无法复活。本文件在build_utils文件夹下的parse_config.py。
2024-06-25 09:24:07
966
原创 YOLOv2理论学习
YOLO9000:Better,Faster,Stronger2017 VCPR448*448学习的资料:https://www.bilibili.com/video/BV1yi4y1g7ro?p=2 原文:Batch Normalization有利于提高收敛速度,帮助模型正则化减少其他形式正则化的需要。通过使用BN层,可以移除Dropout来减少过拟合。 BN层的作用是把一个mini-batch内的所有数据,从不规范的分布拉到正态分布。这样做的好处是使得数据能够分布在激活函数的
2024-06-24 09:50:50
653
原创 YOLOv3代码实现
(2)安装requirements文件,在终端输入命令pip install -r requirements.txt,有时候安装不上,检查自己的网络,换个网络则会安装成功。打开predict_test,在16行左右按照自己的需要进行修改,在当前文件下载一张测试图片,即可运行。打开runs文件夹下的文件,在空白处右键,选择在终端打开,然后输入tensorboard.exe --logdir "./",回车。把这一行的i+1改成i,运行成功,但是如何运行出来像测试单张图片一样的结果,还不会。
2024-06-21 21:31:57
1933
原创 YOLOv1理论学习
题目:You Only Look Once:Unified,Real-Time Object Detection2016 VCPR。
2024-06-20 09:49:42
938
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人