自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 DETR训练自己的数据集

本文记录利用官方提供的代码来训练验证自己的数据集的过程以及一些注意事项。该数据集原始的标签保存格式为yolo类型的txt文件,下面提供的代码能够实现数据集标签从txt文件到coco json格式的转化.该部分为利用训练得到的模型权重进行检测验证。在detr工程文件下的images文件夹存放所有待验证的图片,infer_results存放所有的验证结果。DETR需要的数据集格式为coco格式,其原始图片与标签分为训练集和验证集,其保存目录为。output_dir为保存训练得到的模型权重的地址。

2022-12-09 17:02:32 8952 18

原创 VPGNet数据集解析且将分割标签转化为目标检测标签

VPGNet是一个包含了四个场景(晴天,夜间,阴雨等)下的交通路况数据集,其主要是针对地面标志(箭头线,人行道)的任务,该数据集一共包括以下17类地面标注该数据集下载地址为:VPGNet数据集下载下载解压得到的数据集文件格式为Scene_x—%datetime_aaa_xxx-----id.mat该数据集的所有有用信息均保存在一个(6404805)的mat文件中。数据集的关键信息均保存在(6404805)的数组中,前三个通道为图片的rgb三通道信息,第四维通道为图像的17类二值分割图像(像素值为

2022-12-06 16:30:19 2162 9

原创 DETR、conditional DETR、Deformable DETR

DETR是将transformer机制应用到目标检测领域的算法模型。其主要思想是利用transformer的encoder-decoder架构,利用注意力机制来实现端到端获得目标检测的结果。如图所示为DETR模型的结构,其主要由backbone,transformer block,prediction heads三部分组成。backbone作为输入图像的初步特征提取,主要由卷积神经网络如(resnet50)完成,对于输入图像(B×3×H×W),其中B为batch_size,H,W为图像的宽高。

2022-11-22 18:00:25 2490

原创 VIT模型个人笔记

前言VIT模型即vision transformer,其想法是将在NLP领域的基于自注意力机制transformer模型用于图像任务中,相比于图像任务中的传统的基于卷积神经网络模型,VIT模型在大数据集上有着比卷积网络更强的效果和更节约的成本。transformertransformer模型...

2022-03-01 10:07:20 12522 1

原创 图注意力网络(GAT)

一、图数据结构知识图是指一系列相互连接的节点,且每个节点自己也具有一定的特征。如下图所示即一个典型的图结构。 该图一共有五个结点,每个结点有自己的特征Fi.另一方面,为了描述图的结构特点,常用邻接矩阵A和度矩阵D.其中,对于一个N个结点的图来说,邻接矩阵A为一个大小为N*N的对称矩阵,若两个结点i,j直接有连接,则Aij=Aji=1,否则为0.度矩阵D大小同样,除对角线上,其余位置的值均为0,Dii的值为与结点i直接连接的结点的数目。实际处理中还存在一种常见的矩阵拉普拉斯矩阵L,L=D-A。二、图注

2022-02-02 20:54:21 22302 4

原创 YOLO V3个人笔记

Yolo v3算法的理解YOLO V3算法在基于V1 V2的算法基础上,做了以下几个方面的改进来增加算法的性能多尺度下的Anchor box YOLO v3算法分别在三个不同的尺度下各得到9个anchor box,与YOLO V2产生anchor box 的方法一样,我们同样采用在三个不同尺度下使用k-means算法,一共得到9个anchor box。 通过这样的方法得到更多大小的anchor box,有利于对于小目标的目标检测特征提取 与YOLO v2采用Darklet-19

2021-10-25 08:27:09 221

原创 YOLO v2算法改进理解(自己的笔记理解)

YOLO V2算法原理理解在YOLO V1算法中存在两个明显的缺点,一是由于每个bounding box的产生在一开始是无规律的,因此该算法在定位误差上并不理想,其次,由于YOLO v1每张图片只产生772个预测框,因此对于密度大的小物体目标的检测的效果也不理想。为此,YOLO v2算法提出了一系列想法来改进这些问题,提高目标检测的recall(即检测出所有目标的能力)和定位能力。批归一化操作 批归一化操作,即对每个神元得到的输入数据xi,我们通过求其均值和方差,将其归一化到满足(0,1)分

2021-10-10 11:45:24 471

原创 2021-10-04

python利用 mediapipe库做人体关健点检测 mediapipe库是对人体33个关键点做检测并标记的一个功能库,其33个人体关键点如下图所示该库的具体用法如下1.对静态图像标记import mediapipe as mp #引入库mp_pose = mp.solutions.pose # 导入绘制函数 mp_drawing = mp.solutions.drawing_utils self.cv_show("s",img) pose = mp_

2021-10-04 23:15:25 501

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除