- 博客(9)
- 收藏
- 关注
原创 Focal Modulation Networks-焦点调制网络
图2:(窗口方向)自我注意(SA)[79,22,54]与我们提出的焦点调制之间的说明性比较。给定查询令牌和目标令牌(,····,),SA首先执行查询键交互以计算注意分数,然后执行查询值聚合以从其他令牌中捕获上下文。相比之下,Focal Modulation首先将不同粒度级别的空间上下文编码为调制器(,,,),然后以查询相关的方式自适应地注入查询令牌。显然,SA需要大量的交互和聚合操作,而我们的Focal Modulation颠倒了它们的顺序,使它们都变得轻量级。彩色的数字更好看。
2024-01-15 22:49:33
2271
原创 跑YOLOv7遇到的问题
Batch size设置过高:Batch size设置过高也会导致模型训练不稳定,并可能导致val/obj_loss上升。训练集和验证集的分割不合理:如果训练集和验证集的分割不合理,那么验证集上的表现可能无法反映模型在实际场景中的表现。模型结构设计不合理:模型结构设计也可能导致val/obj_loss的上升,例如层数过深、过宽、非常规的激活函数等。调整学习率和Batch size:可以通过多次实验,逐步调整学习率和Batch size,找到最优的设置参数。2.删除数据集中的.cache文件。
2023-12-14 15:51:53
1109
2
原创 yolov5代码学习总结
偏差(布尔值,可选)– 如果 ,将可学习的偏差添加到 输出。违约:TrueTrue。组(整数,可选)– 来自输入的阻止连接数 通道到输出通道。填充(整数、元组或 str,可选)– 添加到 输入。膨胀(整数或元组,可选)– 内核之间的间距 元素。in_channels (int) – 输入图像中的通道数。out_channels (int) – 卷积产生的通道数。kernel_size(int 或元组)– 卷积内核的大小。步幅(整数或元组,可选)– 卷积的步幅。
2023-12-14 15:30:36
433
原创 运行yolo代码中,遇到的错误,以及解决办法
提示:在train.py文件中的scaler.scale(loss).backward()前添加torch.use_deterministic_algorithms(False)这个错误说的是标签对不上,仔细检查标注的txt文件,发现标签是1,只分了一个类,标签是1,明显错误。注意:.cache文件也有可能在数据集的images和labels文件夹中,要注意仔细查找。解决办法:找到数据集文件夹中的全部.cache文件,并将他们全部删除。解决办法:要不增加0类的数据,要不将1改成0。这个错误目前没有解决。
2023-12-12 15:20:27
1857
Focal Modulation Networks-翻译
2024-01-14
运行yolov5代码时出现报错的问题
2023-04-04
dcgan如何单张保存生成的图片
2023-03-05
TA创建的收藏夹 TA关注的收藏夹
TA关注的人