自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(49)
  • 问答 (1)
  • 收藏
  • 关注

原创 word2vec原理总结

word2vec是一个NLP工具,它的特点是量他们之间的关系,挖掘词之间的联系。

2023-07-26 18:14:04 476

原创 【数据结构】第二章 线性表

数据结构线性表总结

2023-07-20 09:55:47 292

原创 【数据结构】第一章 绪论

数据结构相关知识总结

2023-07-19 09:54:22 312

原创 Pytorch基本使用——NLP数据集构建总结

1.定义batch_size大小2.得到batch_size的尺寸3.记录batch_size是否为整数。

2023-07-17 10:22:41 1907

原创 【目标检测】ROI Polling和ROI Align

ROI Pooling和ROI Align都是为了解决目标检测RPN任务后得到的一系列proposals大小不一致的问题。

2023-07-17 08:50:57 744

原创 Pytorch基本使用—参数初始化

在深度学习中,零初始化(Zero Initialization):将所有权重和偏置初始化为0。然而,这种方法会导致所有神经元具有相同的输出,无法破坏对称性,因此不常用。随机初始化(Random Initialization):将权重和偏置随机初始化为较小的随机值。这种方法可以打破对称性,但并不能保证初始化的权重和偏置能够适应网络的输入和输出分布。Xavier初始化(Xavier Initialization):根据每一层的输入维度和输出维度的大小来进行初始化。

2023-07-11 20:52:17 3646

原创 Pytorch基本使用—激活函数

深度学习中遇到比较多的激活函数

2023-07-11 11:13:36 1456

原创 利用Anaconda完成Python环境安装及配置

Pycharm和Anaconda完成Python开发环境配置

2023-07-09 18:33:19 5734

原创 Openpose原理总结

Openpose是一种开源的实时多人姿态估计库,由卡耐基梅隆大学开发。它通过分析图像或视频中的人体关键点来估计人体的姿态,识别身体的各个部分,并推断出人体的姿势信息。Openpose能够同时检测和跟踪多个人的姿态,可以用于人机交互、运动分析、动作捕捉、虚拟现实等各种应用领域。它的工作原理是利用卷积神经网络对输入图像进行特征提取,并使用卷积层、池化层、上采样等操作进行特征融合和输出。Openpose在计算机视觉领域具有重要的应用价值,并且被广泛使用。

2023-07-09 17:56:41 6157 1

原创 Pytorch基本使用——优化器

🎏目录🎏目录🎈1🎄1.1 原理🎄1.2 构造🎄1.3 参数详解——momentum🎄1.4。

2023-07-07 17:27:22 1358

原创 深度学习基础

机器学习是一门专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身性能的学科。基本步骤:获取数据、数据预处理、特征提取、特征选择、推理预测识别(数据预处理、特征提取、特征选择合称为特征表达)

2023-07-04 10:47:05 434

原创 一文读懂候选边界框Selective Search、AnchorBased、Anchor Free

目标检测是计算机视觉中的一项重要任务,主要目的是在图像或视频中识别并定位感兴趣的对象。为了实现这一目标,目标检测算法通常会生成一系列候选边界框,这些框包围了图像中可能存在的目标对象。候选边界框技术对于减少目标检测的计算复杂度和提高检测精度至关重要。

2023-06-17 20:01:29 642 1

原创 YOLO V2原理总结

yolov2在YOLOv1的基础上做了大量的改进,减轻了YOLOv1存在的问题

2023-06-17 19:40:35 685

原创 制作百科词向量

百科词向量**分为如下步骤:**1. 下载2. `WikiExtractort`提取3. 繁体文转化为简体文4. 分词5. 训练模型(获得词向量)6. 测试

2023-06-11 15:49:37 364

原创 FastText原理总结

FastText具有简单的模型,使其在小数据集上也有不错的预测效果。

2023-06-11 15:34:28 152

原创 一文读懂—Pytiorch混合精度训练

复现代码时遇到了自动混合精度。查阅资料得知,Pytorch从1.60开始支持自动混合精度训练。其中自动、混合精度是两个关键词,那么代表什么意思呢?一起来看看吧!

2023-06-01 23:58:11 633

原创 【考研复习】第一章、计算机系统概述

王道计算机系统知识点总结

2023-06-01 19:24:09 184

原创 一文读懂Pytorh Sampler

本文从DataSet、DataLoader和Sampler的关系出发,介绍Pytorch实现的五种采样,并应用到DataLoader中。🎏目录🎈1 DataSet、DataLoader和Sampler的关系🎈2 Sampler🎄2.1 SequentialSampler(顺序采样)🎄2.2 RandomSampler(随即采样)🎄2.3 BatchSampler(批采样)🎄2.4 SubsetRandomSampler(子集随机采样)

2023-06-01 00:31:40 825

原创 【目标检测】常用数据增强从原理到实现

基于深度学习的图像增强操作旨在改善图像质量并提高视觉识别系统的性能。通过对图像进行预处理和增强,可以使其更加清晰、明亮、鲜明,消除噪声、模糊、失真等问题,从而提高图像的可读性和可解释性。复现YOLO代码时遇到了一系列的图像增强操作,接下来从原理到代码进行总结。🎏目录🎈1 图像增强🎄1.1 随机改变图像亮度🎄1.2 转换颜色空间🎄1.3 随机改变饱和度🎄1.4 改变色调🎄1.4 改变颜色平衡🎈2 零填充🎈3 随即水平翻转🎈4 随即裁剪🎈5 Resize🎈6 打包。

2023-05-23 11:45:29 1213

原创 原始SPP及在YOLO中的SPP/SPPF对比详解

在卷积神经网络中我们经常看到固定输入的设计,但是有的时候难以控制,何凯明大神的论文SPPNet中的SPP结构解决了该问题。后续在YOLO系列中也出现了SPP结构及改进的结构,但是作用与最初的SPP结构却是不同的。

2023-05-21 00:56:51 6232 10

原创 YOLO V1原理详解

🎏目录YOLO系列是=一阶段目标检测算法(其中YOLO v1—YOLO v5基于Anchor based,从YOLO v6开始基于Anchor Free)。与以Faster R-CNN为代表的二阶段算法相比,一阶段算法不需要region proposal阶段,直接产生物体的类别概率和位置坐标值。因此,一阶段算法有更快的检测速度。但是一个网格(grid)只预测有限个bbox,覆盖率较低,精度相较于二阶段算法较低。

2023-05-18 09:47:42 4303 1

原创 利用Pytorch实现一个完整的基于深度学习的人脸表情识别项目

图像分类实战,基于Pytorch实现的人脸表情识别

2023-05-11 01:14:38 1445 1

原创 优快云文章模板

常用的文章模板和一些技巧

2023-05-10 00:13:21 340

原创 Vision Transformer(VIT)原理总结

🎏目录VIT,文章题名为An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale,发表于2020年10月。来做图像分类任务,论文中相关实验证明在大规模数据集上做完预训练后的ViT模型,在迁移到中小规模数据集的分类任务上以后,能够取得比CNN更好的性能。

2023-05-05 11:04:30 683

原创 CenterNet原理解析

CenterNet原理总结

2023-05-03 17:42:37 3162

原创 基于飞桨实现项目2 中文场景文字识别

基于PaddleOCR的中文场景识别总结

2023-04-29 01:25:48 1179 1

原创 TensorRT安装

tensorRT安装

2023-04-27 13:07:10 2995 1

原创 基于飞桨实现项目1 车牌识别

车牌识别系统是指能够检测到受监控路面的车辆并自动提取车辆牌照信息(含汉字字符、英文字母、阿拉伯数字及号牌颜色)进行处理的技术。本次是学习该博主https://blog.youkuaiyun.com/qq_36816848/category_12113641.html的项目智慧交通预测系统的一个总结,使用的是飞桨。整个项目用DBNet进行文本检测(寻找文本位置),然后用RARE进行文本识别(识别图像中的文字)。做的事情有整理数据集,然后部署模型训练模型导出模型,最终进行测试。

2023-04-26 17:56:04 1198

原创 transformer原理总结

transformer的个人学习总结

2023-04-25 16:47:59 366

原创 文本检测 DBNet

DBNet的总结

2023-04-21 22:31:41 2276

原创 可变卷积原理总结

可变卷积,解决CNN固定几何形状的问题

2023-04-21 20:04:42 605

原创 目标检测Neck(1)——多尺度问题(FPN)

多尺度融合问题的解决此

2023-04-20 20:02:37 1466

原创 文本识别 CRNN

OCR模型原理总结—RCNN

2023-04-18 00:24:31 1984 2

原创 ST-GCN 自建kinetics数据集

参照的该博主的https://blog.youkuaiyun.com/qq_34551518/article/details/125510050,遇到有些错误,在这里连着流程一起总结一下。

2023-04-16 23:22:05 1504 2

原创 ST-GCN代码解读

ST-GCN代码总结部分

2023-04-16 23:19:02 1534 1

原创 ST-GCN原理总结

1.通常依赖于手工制作的部件或遍历规则,从而导致表达能力有限和泛化困难。这里提出了一种新的动态骨架模型,它通过自动从数据中学习空间和时间模式,超越了以前方法的限制。2.骨架是以图形的形式,不是2D或3D坐标形式,这使得使用卷积网络等经过验证的模型变得困难。因此,将卷积神经网络(cnn)推广到任意结构的图的。该模型将图神经网络扩展到时空模型,用于动作识别的骨架序列的通用表示,称为。

2023-04-16 23:12:00 2616 1

原创 简单总结广播机制

广播机制总结

2023-04-16 23:03:14 180

原创 Pytorch基本使用—自定义数据集

搭建数据集的基础知识和摄像头数据集的搭建

2023-04-15 11:20:35 2465

原创 pytorch基础使用—自定义损失函数

损失函数的定义,二值交叉熵损失,Focal Loss损失

2023-04-15 10:44:46 3225 1

原创 pytorch基本使用——定义模型

我们通过继承torch.nn.Module来实现自己的类,其中__init__和forward__init__:初始化模型forward:向前传播,输入转输出结果Net(上面代码,当执行net=Net()时,__init__就初始化了两个卷积。之后我们会输出数据x,当我们执行net(x)时进行forward正向传播,计算得到最终的结果。

2023-04-12 22:10:56 1166 1

基于YOLO V3 SPP的目标检测

压缩文件中,其中exe是写的一个检测图片目标的界面,打包用的是Nuitka,写界面用的是PySide2.YOLO V3 SPP是用pytorch进行搭建的,这个算法是跟随大佬太阳花的小绿豆(优快云)的教程学习的

2022-10-23

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除