- 博客(72)
- 资源 (9)
- 收藏
- 关注

原创 【深度学习实战—11】:基于Pytorch实现谷歌QuickDraw数据集的下载、解析、格式转换、DDP分布式训练、测试
Quick Draw 数据集是 345 个类别的 5000 万张图纸的集合,由游戏 Quick, Draw!的玩家贡献。这些图画被捕获为带时间戳的矢量,并标记有元数据,包括要求玩家绘制的内容以及玩家所在的国家/地区。Github中提供了两种类型的数据集,分别是 原始数据集 和 预处理后的数据集 。本文将基于quickdraw数据集,对340个类别进行采用分布式训练进行迁移学习。
2024-09-18 15:58:44
898
1
原创 【深度学习实战—13】:基于MediaPipe的虹膜距离估计
人眼虹膜直径范围大概在11.7±0.5mm。因此我们可以利用相似三角形计算人眼与摄像头传感器的距离
2024-10-25 11:08:46
748
原创 【深度学习实战—12】:基于MediaPipe的手势识别
本文将通过 Mediapipe 检测出手部关键点,并通过对各种关键点的位置判别,以达到手势识别的目的。
2024-10-21 20:08:45
3428
原创 NCNN 记录2:NCNN 加载模型的三种方式(以 SqueezeNet 为例)
NCNN加载模型有三种方式,分别是: 1. 直接加载 param 和 bin(明文) 2. 加载二进制的 param.bin 和 bin 3. 从内存加载 param 和 bin
2024-10-16 13:42:42
1734
原创 NCNN 记录1:Ubuntu+CLion+OpenCV+NCNN+Squeezenet 从源码编译到代码输出全流程记录
Ubuntu+CLion+OpenCV+NCNN+Squeezenet 从源码编译到代码输出全流程记录
2024-10-15 17:04:43
1376
原创 【深度学习实战—10】:基于MediaPipe的坐姿检测
MediaPipe 是一款由 Google Research 开发并开源的多媒体机器学习模型应用框架。提供多种错误坐姿情况的判断。
2024-05-29 17:00:56
5575
原创 【深度学习实战—9】:基于MediaPipe的人脸关键点检测
使用谷歌MediaPipe框架实现人脸关键点检测,获取人脸区域400多个3D关键点,并在图中标记出部分区域。
2024-05-29 09:13:57
3483
4
原创 【深度学习实战—7】:基于Pytorch的多标签图像分类-Fashion-Product-Images
基于深度学习的多标签图像分类,使用时尚产品数据集。工程充分将代码解耦,便于代码管理。
2024-05-25 18:24:17
3337
5
原创 【深度学习实战—6】:基于Pytorch的血细胞图像分类(通用型图像分类程序)
图像分类是搞深度学习一定要掌握的一个视觉任务,本文章将基于血细胞数据集实现图像分类!本文程序已解耦,可当做通用型图像分类框架使用。
2023-09-10 14:26:22
4524
13
原创 【深度学习实战—5】:基于AlexNet的CIFAR10数据集分类(附Keras实现)
目录😺一、数据集获取😺二、定义AlexNet😺三、编译并训练😺四、测试模型😺五、预测结果可视化😺六、建立混淆矩阵😺附录:完整程序之前我们用AlexNet进行了手写数字的识别,今天带来对cifar10数据集的分类!文末附完整程序!😺一、数据集获取"""数据集获取"""def get_cifar10_d.
2022-04-10 06:30:00
6168
2
原创 【深度学习实战—4】:基于AlexNet的手写数字识别(附Keras实现)
本节我们带来使用AlexNet经典网络进行手写数字识别!文末附完整程序!很多地方,如数据集获取,网络训练等都和【深度学习实战—3】:基于LetNet-5的手写数字识别(附Keras实现)差不多,有不同的就是网络的搭建,😺一、网络搭建因为论文中的alexnet的输入是(227, 227, 3),所以我们在搭建网络的时候,要将输入改为(28, 28, 1)。
2022-04-09 06:30:00
8626
3
原创 【OpenCV-Python】:基于视频的人脸检测、眼部检测与微笑检测
OpenCV中有专门用来做人脸检测、人眼检测和微笑检测的工具。在作者这个目录下:`D:\anaconda\envs\keras21\Lib\site-packages\cv2\data`,(注:kersa21是作者的虚拟环境,如果没创建虚拟环境,在anaconda下寻找Lib就可以)存在很多.xml文件,这些文件是预训练好的各器官的Haar特征。
2022-04-08 06:30:00
4003
4
原创 【OpenCV-Python】:图像金字塔之高斯金字塔与拉普拉斯金字塔
以多个分辨率来表示图像的一种有效且概念简单的结构就是**图像金字塔**。图像金字塔最初用于机器视觉和图像压缩,一个图像金字塔是一系列以金字塔形状排列的、多分辨率逐步降低的图像集合。金字塔的底部是待处理图像的高分辨率表示,而顶部则包含一个低分辨率近似,当向金字塔的上层移动时,尺寸和分辨率降低。> (美)拉斐尔·C.冈萨雷斯(Rafael C.Gonzalez)著;阮秋琦译.国外电子与通信教材系列 数字图像处理 第3版[M].北京:电子工业出版社.2017.高斯金字塔与拉普拉斯金字塔是常见的两种
2022-04-07 06:30:00
2719
1
原创 【OpenCV-Python】:绘制凸包、构造凸缺陷
目录😺一、绘制凸包🐶1.1 函数API🐶1.2 程序设计🐶1.3 结果可视化😺二、构造凸缺陷🐶2.1 函数API🐶2.2 程序设计🐶2.3 结果可视化😺一、绘制凸包凸包是一个几何图形学中的概念,用不严谨的话来说,凸包就是将最外层的点连接起来构成的凸多边形,凸包包含点集中的所有点。🐶1.1 函数API函数.
2022-04-06 06:00:00
1955
1
原创 【OpenCV-Python】:绘制物体最小外接矩形与圆形
目录😺一、绘制最小外接矩形🐶1.1 函数API🐶1.2 程序设计🐶1.3 结果可视化😺二、绘制最小外接圆形🐶2.1 函数API🐶2.2 程序设计🐶2.3 结果可视化😺一、绘制最小外接矩形🐶1.1 函数API函数:rect = cv2.minAreaRect(contours)参数介绍:参数conto.
2022-04-05 06:00:00
5285
7
原创 【OpenCV-Python】:查找物体轮廓+计算轮廓面积、长度、重心
😺一、查找物体轮廓🐶1.1 函数API函数:img, contours, hierarchy = cv2.findContours(image, mode, method[, contours[, hierarchy[, offset ]]]).
2022-04-04 06:00:00
21333
7
原创 【OpenCV-Python】:图像的傅里叶变换与逆傅里叶变换
# 😺一、知识储备傅里叶变换就是将信号时域转化为频域的过程,本文用程序实现对二维图像的傅里叶变换与逆变换!首先需要知道一维傅里叶变换!⬇️⬇️⬇️## 🐶1.1 一维傅里叶变换一维傅里叶变换的过程如下方动图所示:
2022-04-03 06:00:00
7918
3
原创 【OpenCV-Python】:图像高通滤波、低通滤波、带通滤波实现
目录😺一、高通滤波🐶1.1 原理🐶1.2 程序设计🐶1.3 结果可视化😺二、低通滤波🐶2.1 原理🐶2.2 程序设计🐶2.3 结果可视化😺三、带通滤波🐶3.1 原理🐶3.2 程序设计🐶3.3 结果可视化😺一、高通滤波🐶1.1 原理顾名思义,高通滤波就是允许高频信息通过,低频信息截断的滤波方式。🐶1.2 .
2022-04-02 06:00:00
7165
原创 【OpenCV-Python】:视频直方图的动态显示
一、前言在【OpenCV-Python】:直方图及直方图均衡化(有源码)中我们知道了如何使用plot函数和opencv绘制图像直方图;在【OpenCV-Python】:调用电脑摄像头+读取视频中我们知道了如何读取电脑中的视频并可视化出来今天带来的便是对视频的直方图动.
2022-04-01 06:00:00
1525
原创 【OpenCV-Python】:基于均值、中值、方框、双边和高斯滤波的图像去噪
本节将对经过噪声污染的图像进行去噪,去噪方法包含**均值滤波、中值滤波、方框滤波、双边滤波和高斯滤波**。# 😺一、引言## 🐶1.1 图像用例实验所用的图像为[【OpenCV-Python】:对图像添加高斯噪声与椒盐噪声](https://blog.youkuaiyun.com/qq_42856191/article/details/123701640?spm=1001.2014.3001.5502)中得到的均值为0,方差为0.01的高斯噪声污染图像和噪声密度为0.05的椒盐噪声污染图像,如图所示:
2022-03-31 06:00:00
10116
原创 【OpenCV-Python】:形态学操作之形态学梯度+顶帽运算与黑帽运算
什么是形态学梯度形态学梯度能描述图像亮度变化的剧烈程度,我们可以使用形态学梯度突出物体边缘。常见的几种梯度: - 基本梯度:膨胀后的图像减腐蚀后的图像; - 内部梯度:原图减腐蚀后的图像; - 外部梯度:膨胀后的图像减原图; - 方向梯度:使用X方向与Y方向的直线作为结构元素之后得到的图像梯度。我们常说的形态学梯度一般指基本梯度。
2022-03-30 06:00:00
1368
原创 【OpenCV-Python】:形态学操作之开运算与闭运算
目录😺一、引言😺二、开运算🐶2.1 什么是开运算🐶2.2 程序编写及结果可视化😺三、闭运算🐶3.1 什么是闭运算🐶3.2 程序编写及结果可视化😺一、引言在【OpenCV-Python】:形态学操作之腐蚀与膨胀中介绍了形态学处理的两个基本操作:腐蚀与膨胀,本节带来基于这两个基本操作的其他形态学处理——开运算和闭运算。😺二、开运算.
2022-03-29 06:00:00
10499
5
原创 【OpenCV-Python】:形态学操作之腐蚀与膨胀
目录😺一、引言😺二、腐蚀(erosion)🐶2.1 什么是腐蚀🐶2.2 程序编写及结果可视化😺三、膨胀(erosion)🐶3.1 什么是膨胀🐶3.2 程序编写及结果可视化😺一、引言形态学(morphology)通常表示生物学的一个分支,该分支主要研究动植物的形态核结构。我们使用同一词语表示数学形态学的内容,.
2022-03-28 06:00:00
3509
原创 【OpenCV-Python】:对图像添加高斯噪声与椒盐噪声
😺一、高斯噪声高斯噪声指它的概率密度函数服从高斯分布(即正态分布)的一类噪声。## 🐶1.1 API添加### 🦄1.1.1 函数API我们需要使用`skimage`库中的函数为图像添加高斯噪声。函数式:`skimage.util.random_noise(image, mode=‘gaussian’, seed=None, clip=True, **kwargs)`参数介绍:```python函数式:skimage.util.random_noise(image, mode=
2022-03-27 16:45:50
21188
3
原创 【深度学习实战—3】:基于LetNet-5的手写数字识别(附Keras实现)
目录😺一、数据集获取😺二、定义LeNet-5😺三、编译并训练😺四、测试模型😺五、预测结果可视化😺六、建立混淆矩阵😺附录:完整程序当我们学习了LeNet-5网络和MNIST数据集之后,就要将经典网络用于实战中了!文末附完整程序!😺一、数据集获取"""数据集获取"""def get_mnist_dat.
2022-03-27 06:00:00
11800
29
原创 【深度学习经典网络架构—10】:注意力模块之CBAM
一、简述在[【深度学习经典网络架构—8】:注意力机制之SE_Block](https://blog.youkuaiyun.com/qq_42856191/article/details/123655146?spm=1001.2014.3001.5501)中,我们介绍了CNN的通道注意力模块SE_Block,本次带来的是另一个即用即插的注意力模块CBAM。论文链接:[CBAM: Convolutional Block Attention Module](https://arxiv.org/pdf/1807.0652
2022-03-26 07:30:00
6813
原创 【深度学习经典网络架构—9】:ShuffleNet系列(V1、V2)
一、简述在学术界,大多围绕着如何提高视觉任务的SOTA进行研究,但在工业界,一个良好的模型如何移植到计算能力不足的移动设备上才是重点考虑的问题。ShuffleNet是由旷视研究院于2018年发表在CVPR上的一篇文章。AI四小龙之一的旷视,多次在顶级会议(如CVPR、ECCV、ICCV)上发表文章。ShuffleNet的第一作者 Xiangyu Zhang 张祥雨 也是里程碑式神经网络ResNet的作者!在ShuffleNet中,作者使用了两个操作,分别是==逐点组卷积(pointwise gro
2022-03-25 07:30:00
7180
1
原创 【深度学习经典网络架构—8】:注意力机制之SE_Block
😺一、引言类似于人脑的注意力感知,那卷积神经网络能否也能产生注意力效果呢?答案是:**可以!****SE_Block是SENet的子结构**,作者将SE_Block用于ResNeXt中,并在ILSVRC 2017大赛中拿到了分类任务的第一名,在ImageNet数据集上将top-5 error降低到2.251%,比2016年的最好成绩提高了约25%。论文链接:[Squeeze-and-Excitation Networks](https://arxiv.org/abs/1709.01507)开源
2022-03-24 08:23:11
23162
2
原创 【深度学习经典网络架构—7】:MobileNet系列(V1、V2、V3)
😺一、简述自从AlexNet赢得ImageNet挑战赛:ILSVRC 2012以来,卷积神经网络已成为计算机视觉中的普遍应用。总体趋势是制作更深、更复杂的网络,以实现更高的准确度。然而,这些提高准确性的进步并不一定会使网络在规模和速度方面更有效率。在机器人、汽车自动驾驶和增强现实等许多现实世界的应用中,识别任务需要在计算受限的平台上及时执行。谷歌提出MobileNet的目的就是**构造一个可以在移动端和嵌入式端应用深度学习的网络,使得在CPU上也能达到理想的速度要求。**MobileNet V1
2022-03-23 07:30:00
5150
原创 【OpenCV-Python】:调用电脑摄像头+读取视频
话不多说,直接看代码!import cv2cap = cv2.VideoCapture(0)while(True): ret, frame = cap.read() cv2.imshow('frame', frame) if cv2.waitKey(1) & 0xFF == ord('q'): break cap.release()cv2.destroyAllWindows()贴一张博主用代码得到的视频截图吧!🎃(浅浅的做了
2022-03-22 08:08:28
6075
1
原创 【深度学习实战—番外篇2】:如何保存CIFAR-10数据集图片?
一、简述CIFAR-10数据集是一个包含了60000张32×32的RGB图像数据集,所有图像共被划分为10个类别,分别为:['飞机', '汽车', '鸟', '猫', '鹿', '狗', '青蛙', '马', '船', '卡车']['airplane', 'automobile', 'bird', 'cat', 'deer', 'dog', 'frog', 'horse', 'ship', 'truck']【深度学习实战—2】:基于Keras的cifar10图像分类(非常详细、代码开源)这篇博文已
2022-03-21 12:23:09
4736
原创 【深度学习经典网络架构—6】:DenseNet
CNN作为计算机视觉领域的主流方法,已经诞生了诸多优秀模型(AlexNet、VGG、GoogLeNet、ResNet等),每个模型的优点之前都有介绍。DenseNet的作者是Zhuang Liu(清华大学)、Gao Huang和Kilian Q.Weinberger(康奈尔大学)、Laurens van der Maaten(脸书研究员),论文斩获CVPR 2017最佳论文!论文链接:Densely Connected Convolutional Networks作者借鉴了ResNet思想,但
2022-01-10 21:37:36
4710
原创 【深度学习经典网络架构—5】:ResNet
残差网络创作于2015年,作者是时任微软研究院的四名研究员Kaiming He 何恺明、Xiangyu Zhang 张祥雨、Shaoqing Ren 任少卿、Jian Sun 孙剑!这四位都是AI领域响当当的人物,论文一作[何恺明](http://kaiminghe.com/)可是妥妥的大神,多次在计算机视觉领域的三大顶会(CVPR、ICCV、ECCV)中夺得最佳论文奖、最佳学生论文奖以及多次Best Paper提名,此外,谷歌在2020年发布的学术指标榜单中,CVPR 2015-2019
2022-01-09 22:52:26
3960
原创 【深度学习经典网络架构—4】:GoogLeNet(Incepetion系列V1、V2、V3)
之前我们说VGG拿到了ImageNet挑战赛(ILSVRC2014)分类项目的亚军,冠军就是谷歌提出的GoogLeNet,而**Inception模型是GoogLeNet的核心**。要想提高网络性能,常用方法就是提高神经网络的深度与宽度,但这也会带来两个问题
2022-01-09 15:08:31
6124
3
原创 【深度学习实战—番外篇1】:如何保存MNIST数据集图片?
目录一、数据集介绍一、数据集介绍MNIST数据集是计算机视觉领域的一个入门级数据集!【深度学习实战—1】:基于Keras的手写数字识别这篇博文已经介绍了如何使用MNIST数据集并基于keras框架做了一个分类任务!该篇博文讲详细的介绍如何使用MNIST数据集及其他处理过程。???
2022-01-06 22:41:35
3670
原创 【千锤百炼Python—14】:修改图片格式
我们在做图像处理的时候,如果需要修改图像的后缀名称,可以通过鼠标????️右击重命名操作!如果图像数量过多呢?例如几百几千甚至几万几十万张图像呢?我们肯定不会手动一个个修改后缀。这时,就要利用编程语言进行批处理操作,用计算机运算他不香吗?✨我们只需要一个python的库os就能完成。import osimg_path = "C:\\Users\\Lenovo\\Desktop\\5\\" # 图片所在路径img_name = os.listdir(img_path)for
2022-01-05 12:47:35
1614
1
原创 【千锤百炼Python—13】:获取当前时间
我们可以通过手机、电脑获取当前时间!那能否通过编程的方式得到时间呢!?➡️可以time库是python中处理时间的标准库,我们可以通过调用time中的相关函数获取当前时间!import time# 以字符串的形式返回时间print(time.ctime())# 返回电脑时间print(time.localtime())# 以可读的形式表现出来print(time.strftime("%Y-%m-%d %H:%M:%S", time.localtime()))仿真结果:Tue J
2022-01-04 22:48:57
765
原创 【深度学习经典网络架构—3】:VGG(附Keras实现)
目录一、网络简介二、网络结构2.1 网络配置2.2 网络立体图结构2.3 网络平面图结构三、网络特点四、Keras实现4.1 程序编写4.2 打印模型信息五、总结一、网络简介VGG网络是由牛津大学计算机视觉组和谷歌DeepMind公司共同设计的。VGG网络并且在2014年在ILSVRC大赛上获得了定位项目的第一名和分类项目的第二名。作者通过VGG论证了一个非常重要的结论:CNN的深度与小卷积核的使用对图像识别与分类有很大影响!论文链接:Very Deep Convolutional Network
2021-12-16 19:58:00
5222
原创 【深度学习经典网络架构—2】:AlexNet(附Keras实现)
目录一、网络简介二、网络创新点三、网络结构3.1 网络立体图结构3.2 网络平面图结构一、网络简介我们知道LeNet是第一个经典的卷积神经网络,但第一个走进大家视线的是AlexNet!AlexNet是由Alex Krizhevsky、Ilya Sutskever和Geoffrey E. Hinton三人提出的,文章发表于2012年,AlexNet网络拿到了ImageNet LSVRC-2010比赛的冠军(ImageNet LSVRC-2010比赛要求参赛者在具有1.2 million的高分辨率图像数据
2021-12-16 09:55:42
7066
2
NCNN 加载模型的三种方式(以 SqueezeNet 为例)博客资源
2024-10-16
机器学习-监督学习-毒蘑菇分类-6大监督模型实现
2024-03-01
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人