- 博客(25)
- 收藏
- 关注
原创 LSTM Fully Convolutional Networks for Time Series Classification
原文:全卷积神经网络(FCN)已被证明在时间序列分类任务上具有最先进的性能。我们提出用长短期记忆递归神经网络(LSTM RNN)子模块增强全卷积网络用于时间序列分类。我们提出的模型显著提高了全卷积网络的性能,模型大小有了名义上的增加,并且只需要对数据集进行最小的预处理。提出的长短期记忆全卷积网络(LSTM-FCN)与其他网络相比具有最先进的性能。我们还探索了使用注意机制改进时间序列分类的注意长短期记忆全卷积网络(ALSTM-FCN)。利用注意机制可以使LSTM细胞的决策过程可视化。
2023-06-26 14:50:17
1090
原创 Detr代码解读(一)数据加载
Detr模型如上图所示,简单来讲,就是将图片进行CNN特征提取后送入Transformer模块,然后直接生成预测框,设置个阈值后,生成的预测框就是预测结果,不需要再经历NMS操作。Detr用的数据集格式为coco数据集格式,所以在进行Detr算法前,需要将我们的数据集转为coco数据集,可参考。是现在数据集下面训练集跟验证集的名称,如果跟你数据集名称不一样,可以在这里改成你数据集下的名称。的图片跟标注进行处理,首先先获取图片id,然后获取标注信息,获取目标类别,然后将这些转为。之前写过一篇数据加载机理的。
2023-05-05 19:14:03
1804
原创 VOC格式转COCO格式
有些开源的算法数据集用的是coco格式,我们用标注软件标注自己的数据时,可能会按VOC格式来标注,这时候为了适配开源算法,就需把VOC转COCO格式。根据划分好的train_txt跟text.text文件将train跟val的编号跟他们对应的xml文件放到ann_train跟ann_val文件夹里。下图是将VOC转coco后的格式,coco数据集的图片跟VOC是一样的,但是他的标注全部放在一个annotations文件中的单一json文件中。VOC数据集中的Imageset文件里有划分好的。
2023-05-05 11:01:58
4272
2
原创 Transformer论文学习
摘要部分首先点到现存主要的序列转换模型都是基于RNN或者CNN网络,表现最好的模型也是用了注意力机制。所以该团队直接提出一个完全基于注意力机制的模型。【Transformer】,然后讲述这个模型在德语翻英语数据集上的表现。背景介绍里主要讲了一下RNN怎么去做序列转换这个工作,拿李沐老师的图解释一下:假设做中英文翻译,下图是可以看成是RNN模型做翻译的一个流程:红色部分是因子计算,下面蓝色方块为英文序列信息,第一个方块里存的HelloHelloHello,它通过因子计算后输出你。
2023-04-25 20:28:21
297
原创 Yolov8训练调试简单教程
YOLOV5跟YOLOV8的项目都是ultralytics发布的,刚下载YOLOV8的时候发现V8的项目跟V5变化还是挺大的,看了一下README同时看了看别人写的。大致是搞懂了V8具体使用。这一篇笔记,大部分都是项目里的文档内容。建议直接去看项目里的文档。首先在V8中需要先安装,这是作者ultralytics出的第三方python库。
2023-04-14 16:43:46
10336
7
原创 Yolov7学习笔记(六)损失函数计算
bs, 3, 20, 20, 25]意味这这个layer有8张图,且有3个anchor,特征图层的尺寸为20*20,每个网格有25个值,前4个为预测框中心点,第5个为这个预测框的目标置信度,后20个为预测框的类别置信度。真实框尺寸为[number,6],这个number指的是这一个batch_size中有多少个真实框,例子的batch_size=8,number=27,如下图所示,这8张图片中有27个真实框。中的置信度损失和类别损失用的是二元交叉熵来做的,而定位损失是用的CIOU Loss来做的,
2023-04-11 16:33:55
15436
7
原创 Yolov7学习笔记(四)数据加载
self.rand()随机生成一个0-1的数,如果这个数小于self.mosaic_prob的值,也就是百分50的概率打开Mosaci,且在训练的前70%epoch才能打开Mosaci,在同时满足这些的条件下,进行Mosaic训练,Mixup是在Mosiac的基础上,有50%的概率取用。真实框格式如下图所示,真实框的内容是左上角右下角坐标,将真实框送入模型进行预测,需要将真实框转换为相对锚框的偏移量,然后预测处理的预测框也是相对锚框偏移量的格式来表示。然后将获取图片真实宽和高,再获取真实框。
2023-04-07 18:39:38
1306
原创 Yolov7学习笔记(三)训练部分
思路为:将预训练权重字典按key跟对应内容取出,判断key是否跟模型的key重合,如果重合就记录到临时字典里,直到把预训练权重都判断完毕,然后将临时字典的权重更新到模型权重里。训练阶段还是比较熟悉的几个流程,如从加载器中取出图片,然后向前传播,损失计算,反向传播,梯度更新,在验证阶段用到了ema也就是权值平滑。然后做验证集loss计算与Map计算,当验证机的loss小于历史所存最小loss则保存该轮的训练权值。对预模型参数做平均操作,增加模型训练时的鲁棒性,是用来在test或val时才使用,用来更新参数。
2023-04-07 10:53:32
1287
原创 Yolov7学习笔记(二)预测部分
输入的图片对其做缩放处理,具体为,将图片按输入比例缩放,图片的长边等于输入图片的长边尺寸,图片的短边按图片本身的比例缩放。== self.anchors_mask[i] : [[6, 7, 8], [3, 4, 5], [0, 1, 2]]==是为3个不同特征层挑选锚框尺寸。前4为是坐标,但是预测框的坐标是相对锚框的偏移量,且格式是[x,y,w,h]的,将其转换为[x,y,x,y]的格式。挑选尺寸为尺寸为[142,110],[192,243],[459,401]的锚框。3个图层处理完后输出图片,完成解码。
2023-04-06 18:07:39
1651
原创 Yolov7学习笔记(一)模型结构
个人学习笔记,项目代码参考Bubbliiiing的yolov7-pytorch-master版1、Pytorch搭建YoloV7目标检测平台源码2、最终版本YOLOv1-v7全系列大解析3、三万字硬核详解:yolov1、yolov2、yolov3、yolov4、yolov5、yolov74、yolo系列的Neck模块。
2023-04-04 19:59:19
5163
原创 SSD模型解读(五)损失函数Loss部分代码解读
用来判断是不是目标,中间20位是类别,其实只有真实框与锚框匹配上的时候才处理匹配上的那个锚框,没匹配上框数值都是默认值,最后再提一点,
2023-04-03 18:17:47
1615
原创 SSD模型解读(四)数据集加载部分SSDDataset类代码解读- SSDData类解读
以这8个锚框为例,编号为0的锚框匹配的是编号为1的真实框,编号为1的锚框匹配的是编号为1的真实框,以此类推,可以看到每个锚框只匹配一个真实框。真实框格式如下图所示,真实框的内容是左上角右下角坐标,将真实框送入模型进行预测,需要将真实框转换为相对锚框的偏移量,然后预测处理的预测框也是相对锚框偏移量的格式来表示。再根据81个已经匹配完真实框的锚框,其中每一个锚框选的是5个真实框中的哪个的索引,取检索boxes中的类别,将其赋值给81个锚框的类别属性。然后将获取图片真实宽和高,再获取真实框。
2023-03-31 21:20:46
1354
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人