- 博客(49)
- 问答 (1)
- 收藏
- 关注
原创 Pytorch基本使用——NLP数据集构建总结
1.定义batch_size大小2.得到batch_size的尺寸3.记录batch_size是否为整数。
2023-07-17 10:22:41
1907
原创 【目标检测】ROI Polling和ROI Align
ROI Pooling和ROI Align都是为了解决目标检测RPN任务后得到的一系列proposals大小不一致的问题。
2023-07-17 08:50:57
744
原创 Pytorch基本使用—参数初始化
在深度学习中,零初始化(Zero Initialization):将所有权重和偏置初始化为0。然而,这种方法会导致所有神经元具有相同的输出,无法破坏对称性,因此不常用。随机初始化(Random Initialization):将权重和偏置随机初始化为较小的随机值。这种方法可以打破对称性,但并不能保证初始化的权重和偏置能够适应网络的输入和输出分布。Xavier初始化(Xavier Initialization):根据每一层的输入维度和输出维度的大小来进行初始化。
2023-07-11 20:52:17
3646
原创 Openpose原理总结
Openpose是一种开源的实时多人姿态估计库,由卡耐基梅隆大学开发。它通过分析图像或视频中的人体关键点来估计人体的姿态,识别身体的各个部分,并推断出人体的姿势信息。Openpose能够同时检测和跟踪多个人的姿态,可以用于人机交互、运动分析、动作捕捉、虚拟现实等各种应用领域。它的工作原理是利用卷积神经网络对输入图像进行特征提取,并使用卷积层、池化层、上采样等操作进行特征融合和输出。Openpose在计算机视觉领域具有重要的应用价值,并且被广泛使用。
2023-07-09 17:56:41
6157
1
原创 深度学习基础
机器学习是一门专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身性能的学科。基本步骤:获取数据、数据预处理、特征提取、特征选择、推理预测识别(数据预处理、特征提取、特征选择合称为特征表达)
2023-07-04 10:47:05
434
原创 一文读懂候选边界框Selective Search、AnchorBased、Anchor Free
目标检测是计算机视觉中的一项重要任务,主要目的是在图像或视频中识别并定位感兴趣的对象。为了实现这一目标,目标检测算法通常会生成一系列候选边界框,这些框包围了图像中可能存在的目标对象。候选边界框技术对于减少目标检测的计算复杂度和提高检测精度至关重要。
2023-06-17 20:01:29
642
1
原创 制作百科词向量
百科词向量**分为如下步骤:**1. 下载2. `WikiExtractort`提取3. 繁体文转化为简体文4. 分词5. 训练模型(获得词向量)6. 测试
2023-06-11 15:49:37
364
原创 一文读懂—Pytiorch混合精度训练
复现代码时遇到了自动混合精度。查阅资料得知,Pytorch从1.60开始支持自动混合精度训练。其中自动、混合精度是两个关键词,那么代表什么意思呢?一起来看看吧!
2023-06-01 23:58:11
633
原创 一文读懂Pytorh Sampler
本文从DataSet、DataLoader和Sampler的关系出发,介绍Pytorch实现的五种采样,并应用到DataLoader中。🎏目录🎈1 DataSet、DataLoader和Sampler的关系🎈2 Sampler🎄2.1 SequentialSampler(顺序采样)🎄2.2 RandomSampler(随即采样)🎄2.3 BatchSampler(批采样)🎄2.4 SubsetRandomSampler(子集随机采样)
2023-06-01 00:31:40
825
原创 【目标检测】常用数据增强从原理到实现
基于深度学习的图像增强操作旨在改善图像质量并提高视觉识别系统的性能。通过对图像进行预处理和增强,可以使其更加清晰、明亮、鲜明,消除噪声、模糊、失真等问题,从而提高图像的可读性和可解释性。复现YOLO代码时遇到了一系列的图像增强操作,接下来从原理到代码进行总结。🎏目录🎈1 图像增强🎄1.1 随机改变图像亮度🎄1.2 转换颜色空间🎄1.3 随机改变饱和度🎄1.4 改变色调🎄1.4 改变颜色平衡🎈2 零填充🎈3 随即水平翻转🎈4 随即裁剪🎈5 Resize🎈6 打包。
2023-05-23 11:45:29
1213
原创 原始SPP及在YOLO中的SPP/SPPF对比详解
在卷积神经网络中我们经常看到固定输入的设计,但是有的时候难以控制,何凯明大神的论文SPPNet中的SPP结构解决了该问题。后续在YOLO系列中也出现了SPP结构及改进的结构,但是作用与最初的SPP结构却是不同的。
2023-05-21 00:56:51
6232
10
原创 YOLO V1原理详解
🎏目录YOLO系列是=一阶段目标检测算法(其中YOLO v1—YOLO v5基于Anchor based,从YOLO v6开始基于Anchor Free)。与以Faster R-CNN为代表的二阶段算法相比,一阶段算法不需要region proposal阶段,直接产生物体的类别概率和位置坐标值。因此,一阶段算法有更快的检测速度。但是一个网格(grid)只预测有限个bbox,覆盖率较低,精度相较于二阶段算法较低。
2023-05-18 09:47:42
4303
1
原创 Vision Transformer(VIT)原理总结
🎏目录VIT,文章题名为An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale,发表于2020年10月。来做图像分类任务,论文中相关实验证明在大规模数据集上做完预训练后的ViT模型,在迁移到中小规模数据集的分类任务上以后,能够取得比CNN更好的性能。
2023-05-05 11:04:30
683
原创 基于飞桨实现项目1 车牌识别
车牌识别系统是指能够检测到受监控路面的车辆并自动提取车辆牌照信息(含汉字字符、英文字母、阿拉伯数字及号牌颜色)进行处理的技术。本次是学习该博主https://blog.youkuaiyun.com/qq_36816848/category_12113641.html的项目智慧交通预测系统的一个总结,使用的是飞桨。整个项目用DBNet进行文本检测(寻找文本位置),然后用RARE进行文本识别(识别图像中的文字)。做的事情有整理数据集,然后部署模型训练模型导出模型,最终进行测试。
2023-04-26 17:56:04
1198
原创 ST-GCN 自建kinetics数据集
参照的该博主的https://blog.youkuaiyun.com/qq_34551518/article/details/125510050,遇到有些错误,在这里连着流程一起总结一下。
2023-04-16 23:22:05
1504
2
原创 ST-GCN原理总结
1.通常依赖于手工制作的部件或遍历规则,从而导致表达能力有限和泛化困难。这里提出了一种新的动态骨架模型,它通过自动从数据中学习空间和时间模式,超越了以前方法的限制。2.骨架是以图形的形式,不是2D或3D坐标形式,这使得使用卷积网络等经过验证的模型变得困难。因此,将卷积神经网络(cnn)推广到任意结构的图的。该模型将图神经网络扩展到时空模型,用于动作识别的骨架序列的通用表示,称为。
2023-04-16 23:12:00
2616
1
原创 pytorch基本使用——定义模型
我们通过继承torch.nn.Module来实现自己的类,其中__init__和forward__init__:初始化模型forward:向前传播,输入转输出结果Net(上面代码,当执行net=Net()时,__init__就初始化了两个卷积。之后我们会输出数据x,当我们执行net(x)时进行forward正向传播,计算得到最终的结果。
2023-04-12 22:10:56
1166
1
基于YOLO V3 SPP的目标检测
2022-10-23
TA创建的收藏夹 TA关注的收藏夹
TA关注的人