梨涡的漫漫求学路-优快云博客

原创 Focal Modulation Networks-焦点调制网络

图2:(窗口方向)自我注意(SA)[79,22,54]与我们提出的焦点调制之间的说明性比较。给定查询令牌和目标令牌(，····，)，SA首先执行查询键交互以计算注意分数，然后执行查询值聚合以从其他令牌中捕获上下文。相比之下，Focal Modulation首先将不同粒度级别的空间上下文编码为调制器(，，，)，然后以查询相关的方式自适应地注入查询令牌。显然，SA需要大量的交互和聚合操作，而我们的Focal Modulation颠倒了它们的顺序，使它们都变得轻量级。彩色的数字更好看。

2024-01-15 22:49:33 2271

原创训练YOLOv7---有关FPS计算的问题

计算FPS时遇到的问题

2024-01-15 22:36:35 4851 5

原创跑YOLOv7遇到的问题

Batch size设置过高：Batch size设置过高也会导致模型训练不稳定，并可能导致val/obj_loss上升。训练集和验证集的分割不合理：如果训练集和验证集的分割不合理，那么验证集上的表现可能无法反映模型在实际场景中的表现。模型结构设计不合理：模型结构设计也可能导致val/obj_loss的上升，例如层数过深、过宽、非常规的激活函数等。调整学习率和Batch size：可以通过多次实验，逐步调整学习率和Batch size，找到最优的设置参数。2.删除数据集中的.cache文件。

2023-12-14 15:51:53 1109 2

原创 yolov5代码学习总结

偏差（布尔值，可选）– 如果，将可学习的偏差添加到输出。违约：TrueTrue。组（整数，可选）– 来自输入的阻止连接数通道到输出通道。填充（整数、元组或 str，可选）– 添加到输入。膨胀（整数或元组，可选）– 内核之间的间距元素。in_channels （int） – 输入图像中的通道数。out_channels （int） – 卷积产生的通道数。kernel_size（int 或元组）– 卷积内核的大小。步幅（整数或元组，可选）– 卷积的步幅。

2023-12-14 15:30:36 433

原创学习yolov7源码

建立数据集文件夹。

2023-12-12 17:34:08 516

原创运行yolo代码中，遇到的错误，以及解决办法

提示：在train.py文件中的scaler.scale(loss).backward()前添加torch.use_deterministic_algorithms(False)这个错误说的是标签对不上，仔细检查标注的txt文件，发现标签是1，只分了一个类，标签是1，明显错误。注意：.cache文件也有可能在数据集的images和labels文件夹中，要注意仔细查找。解决办法：找到数据集文件夹中的全部.cache文件，并将他们全部删除。解决办法：要不增加0类的数据，要不将1改成0。这个错误目前没有解决。

2023-12-12 15:20:27 1857

原创 css01

b站pink老师的前端课程--css第一课

2022-07-24 10:11:06 143

原创 html02

b站pink老师前端课程--html第二课

2022-07-24 10:09:40 133

原创 html01

b站pink老师的前端课程笔记---html第一节课

2022-07-24 09:51:22 195

Focal Modulation Networks-翻译

本文介绍了使用Focal Modulation替代自注意力（self-attention）的FocalNet(Focal Modulation Network)网络，新模块具有更好的token交互效果。近些年，Transformers在自然语言处理、图像分类、目标检测和图像分割上均取得了较大的成功，归根结底是自注意力（SA ：self-attention）起到了关键性的作用，因此能够支持输入信息的全局交互。但是由于视觉tokens的大量存在，自注意力的计算复杂度高，尤其是在高分辨的输入时，因此针对该缺陷，本文提出了FocalNet网络。

2024-01-14

运行yolov5代码时出现报错的问题

2023-04-04

dcgan如何单张保存生成的图片

2023-03-05

TA创建的收藏夹 TA关注的收藏夹

TA关注的人