- 博客(112)
- 收藏
- 关注
原创 12.12深度学习_CNN_项目实战
关于项目的基本介绍。本项目实现的是对猫科动物的划分,划分的物种有猫、狗、野生三种分类,属于小颗粒度分类大颗粒度分类:以物种作为分类,比如飞机、青蛙、狗、猫、马、鹿等。实体颗粒度分类:具体到具体的人,比如指纹识别、人脸识别等具体的个体,具体的实体 本项目旨在使用卷积神经网络(CNN)进行图像分类任务。我们将使用 LeNet5(衍生) 模型来训练一个可以区分猫、狗和野生动物的分类器。项目中包括了数据预处理、模型训练、测试、验证以及单张图片推理等功能。问题。
2024-12-19 19:47:00
1194
原创 12.9深度学习_经典神经网络_ Mobilenet V3
通过之前的课程,了解并学习了MobileNetV1和MobileNetV2的相关内容和网络节点,这一章节学习MobileNetV3的相关内容,在现在比较流行一些边缘终端上,以MobileNetV3为识别网络或者为骨干网络是比较常用的,下图是MobileNetV2和MobileNet3的比较图,横坐标是在在谷歌自己做的Pixel 1手机上的延迟,纵坐标是准确率,可以看出,在相同延时下,MobileNet V3准确率更高。
2024-12-19 19:22:13
1689
原创 12.9深度学习_经典神经网络_MobileNet V1&V2
传统的卷积神经网络参数量大,导致预测时算力大,对于手机、嵌入式等设备来讲是不行的,例如VGG16大概有490M,ResNet的152层模型有644M,这种是不能在移动端部署的时候不但慢还暂用空间,就无法满足手机、人脸识别打卡机等。2017年,Google提出的移动端高效率模型MobileNet:相比VGG16,分类准确率下降了0.9%,但是模型参数仅仅是VGG16的1/32到1/33。
2024-12-19 19:18:35
1310
原创 12.8深度学习_经典神经网络_ResNet
深层网络有个梯度消失问题:模型变深时,其错误率反而会提升,该问题非过拟合引起,主要是因为梯度消失而导致参数难以学习和更新。
2024-12-19 19:02:28
465
原创 12.7深度学习_经典神经网络_VGG
VGG的亮点在于它通过堆叠多个卷积层,以小的卷积核和池化层的方式来增加网络深度,从而实现高精度的图像识别。这种方法可以有效地捕获图像中的高级特征,并通过不断拟合训练数据来提高识别准确率。
2024-12-19 18:51:02
923
原创 12.6深度学习_经典神经网络_LeNets5
模块的思想nn.Conv2d(stride=1,padding=0,# 业务逻辑的实现# 通过这个i我们可以拿到ModuleList中的对应的卷积层# 拿到3输入通道 s[N, (i, (i + 3)%6), H, W] 4:0---->[4,5,0]# 针对5去1的处理# 先变成5个# 再去掉中间的# 使用卷积层对数据进行卷积操作# 拼接到总的输出通道# 网络层nn.Conv2d(),# 自适应的做到14 * 14# C3# S4:自适应池化# C5# 输出层。
2024-12-16 20:19:09
1112
原创 12.10深度学习_经典神经网络_GoogleNet自我理解
通过上述表格,我们可以清楚地看到 GoogLeNet 的前几层是如何逐步处理输入图像的。每个卷积层和池化层都有明确的参数设置,确保了网络能够有效地提取特征并减少计算量。特别是 Inception 模块的设计,通过引入不同大小的卷积核和池化操作,使得网络能够在多个尺度上捕捉图像特征,同时利用1x1卷积核进行降维,减少了参数数量,提高了计算效率。
2024-12-10 19:22:14
1240
原创 12.6深度学习_模型优化和迁移_模型移植
Open Neural Network Exchange(ONNX,开放神经网络交换)格式,是一个用于表示深度学习模型的标准,可使模型在不同框架之间进行转移。 ONNX的规范及代码主要由微软,亚马逊 ,Face book 和 IBM等公司共同开发,以开放源代码的方式托管在Github上。目前官方支持加载ONNX模型并进行推理的深度学习框架有: Caffe2, PyTorch, PaddlePaddle, TensorFlow等。
2024-12-08 22:44:04
613
原创 12.4深度学习_模型优化和迁移_awanb、tb
免费,成本低PyTorch: https://pytorch.org/vision/stable/datasets.html开源数据集imagenet:https://image-net.org/Hugging Face数据集:https://huggingface.co/datasetskaggle数据集下载网址:https://www.kaggle.com/datasets各种网站:https://public.roboflow.com/https://zhuanlan.zhihu.com/p/6
2024-12-05 19:37:25
1193
原创 12.2深度学习_视觉处理CNN_池化层、卷积知识
池化层 (Pooling) 降低维度, 缩减模型大小,提高计算速度. 即: 主要对卷积层学习到的特征图进行下采样(SubSampling)处理。池化层主要有两种:最大池化 max pooling最大池化是从每个局部区域中选择最大值作为池化后的值,这样可以保留局部区域中最显著的特征。最大池化在提取图像中的纹理、形状等方面具有很好的效果。平均池化 avgPooling平均池化是将局部区域中的值取平均作为池化后的值,这样可以得到整体特征的平均值。
2024-12-04 09:21:14
1471
原创 12.2深度学习_视觉处理CNN_卷积层
卷积神经网络是深度学习在计算机视觉领域的突破性成果。在计算机视觉领域, 往往我们输入的图像都很大,使用全连接网络的话,计算的代价较高。另外图像也很难保留原有的特征,导致图像处理的准确率不高。 卷积神经网络(Convolutional Neural Network,CNN)是一种专门用于处理具有网格状结构数据的深度学习模型。最初,CNN主要应用于计算机视觉任务,但它的成功启发了在其他领域应用,如自然语言处理等。
2024-12-03 09:16:58
792
原创 12.2深度学习_卷积层输出尺寸的计算公式
,你可以使用类似的公式来计算池化后的输出尺寸。如果你在卷积层后添加了池化层(例如。我们可以根据上述公式计算。假设我们有一个输入张量。
2024-12-02 16:47:43
404
原创 12.2深度学习_项目实战
鲍勃开了自己的手机公司。他想与苹果、三星等大公司展开硬仗。他不知道如何估算自己公司生产的手机的价格。在这个竞争激烈的手机市场,你不能简单地假设事情。为了解决这个问题,他收集了各个公司的手机销售数据。鲍勃想找出手机的特性(例如:RAM、内存等)和售价之间的关系。但他不太擅长机器学习。所以他需要你帮他解决这个问题。在这个问题中,你不需要预测实际价格,而是要预测一个价格区间,表明价格多高。
2024-12-02 09:25:50
1179
原创 11.29深度学习_过拟合欠拟合批量、标准化
在训练深层神经网络时,由于模型参数较多,在数据量不足时很容易过拟合。而正则化技术主要就是用于防止过拟合,提升模型的泛化能力()和鲁棒性(
2024-12-02 09:25:01
934
原创 11.28深度学习_bp算法
梯度下降算法通过不断更新参数来最小化损失函数,是反向传播算法中计算权重调整的基础。在实际应用中,根据数据的规模和计算资源的情况,选择合适的梯度下降方式(批量、随机、小批量)及其变种(如动量法、Adam等)可以显著提高模型训练的效率和效果。 Adam是目前最为流行的优化算法之一,因其稳定性和高效性,广泛应用于各种深度学习模型的训练中。Adam结合了动量法和RMSProp的优点,能够在不同情况下自适应调整学习率,并提供快速且稳定的收敛表现。
2024-11-28 17:14:03
378
原创 11.28深度学习_bp算法实现和详解
网络参数初始化return x网络结构:定义了一个包含两个全连接层的简单神经网络。前向传播:计算输入数据通过网络的输出。损失计算:计算输出与目标之间的均方误差损失。反向传播:计算损失函数关于每个参数的梯度。参数更新:使用优化器更新网络参数。
2024-11-28 11:06:41
1152
原创 11.26深度学习_激活函数-损失函数
当输出层使用softmax多分类时,使用交叉熵损失函数;当输出层使用sigmoid二分类时,使用二分类交叉熵损失函数, 比如在逻辑回归中使用;当功能为线性回归时,使用smooth L1损失函数或均方差损失-L2 loss;
2024-11-27 21:40:59
783
原创 11.26深度学习_神经网络-数据处理
在使用Torch构建网络模型时,每个网络层的参数都有默认的初始化方法,同时还可以通过以上方法来对网络参数进行初始化。
2024-11-27 21:32:12
1240
原创 11.22Pytorch_自动微分
自动微分模块torch.autograd负责自动计算张量操作的梯度,具有自动求导功能。自动微分模块是构成神经网络训练的必要模块,可以实现网络权重参数的更新,使得反向传播算法的实现变得简单而高效。
2024-11-25 20:09:15
559
原创 如何理解tensor中张量的维度
理解dim=0dim=1dim=2以及(x, y, z)的意思,关键在于明确每个维度在张量中的作用。让我们通过具体的例子来详细解释这些概念。
2024-11-24 14:44:07
1211
1
原创 11.20Pytorch_概数和基础
PyTorch是一个基于Python的深度学习框架,它提供了一种灵活、高效、易于学习的方式来实现深度学习模型。PyTorch最初由Facebook开发,被广泛应用于计算机视觉、自然语言处理、语音识别等领域。 PyTorch使用张量(tensor)来表示数据,可以轻松地处理大规模数据集,且可以在GPU上加速。
2024-11-20 18:58:09
1113
原创 11.19机器学习_逻辑回归
逻辑回归(Logistic Regression)是机器学习中的一种分类模型,,虽然名字中带有回归,但是它与回归之间有一定的联系。由于算法的简单和高效,在实际中应用非常广泛。逻辑回归一般用于二分类问题,比如:是好瓜还是坏瓜健康还是不健康可以托付终身还是不可以。
2024-11-19 17:07:10
1235
原创 11.15机器学习_线性回归
十 集成学习方法之随机森林机器学习中有一种大类叫集成学习(Ensemble Learning),集成学习的基本思想就是将多个分类器组合,从而实现一个预测效果更好的集成分类器。集成算法可以说从一方面验证了中国的一句老话:三个臭皮匠,赛过诸葛亮。集成算法大致可以分为:Bagging,Boosting 和 Stacking 三大类型。(1)每次有放回地从训练集中取出 n 个训练样本,组成新的训练集;(2)利用新的训练集,训练得到M个子模型;(3)对于分类问题,采用投票的方法,得票最多子模型的分类类别为最终
2024-11-15 18:54:53
974
原创 11.14机器学习_贝叶斯和决策树
假设现在我们有一个数据集,它由两类数据组成,数据分布如下图所示:也就是说,我们会选择高概率对应的类别。这就是贝叶斯决策理论的核心思想,即选择具有最高概率的决策。已经了解了贝叶斯决策理论的核心思想,那么接下来,就是学习如何计算p1和p2概率。
2024-11-14 20:23:31
1411
原创 11.13机器学习_KNN和模型选择调优
获取数据、数据处理、特征工程后,就可以交给预估器进行机器学习,流程和常用API如下。1.实例化预估器(估计器)对象(estimator), 预估器对象很多,都是estimator的子类(1)用于分类的预估器sklearn.neighbors.KNeighborsClassifier k-近邻sklearn.naive_bayes.MultinomialNB 贝叶斯sklearn.linear_model.LogisticRegressioon 逻辑回归。
2024-11-13 22:22:43
1320
原创 11.12机器学习_特征工程
特征工程:就是对特征进行相关的处理一般使用pandas来进行数据清洗和数据处理、使用sklearn来进行特征工程特征工程是将任意数据(如文本或图像)转换为可用于机器学习的数字特征,比如:字典特征提取(特征离散化)、文本特征提取、图像特征提取。特征工程步骤为:特征提取, 如果不是像dataframe那样的数据,要进行特征提取,比如字典特征提取,文本特征提取无量纲化(预处理)降维底方差过滤特征选择主成分分析-PCA降维。
2024-11-12 20:31:22
1297
原创 11.11机器学习_介绍和定义
Python语言机器学习工具Scikit-learn包括许多智能的机器学习算法的实现Scikit-learn文档完善,容易上手,丰富的API接口函数Scikit-learn官网:https://scikit-learn.org/stable/#Scikit-learn中文文档:https://scikitlearn.com.cn/scikit-learn中文社区数据量小,数据在sklearn库的本地,只要安装了sklearn,不用上网就可以获取数据量大,数据只能通过网络获取。
2024-11-11 17:34:20
3529
原创 11.6Open-CV_课堂案例_guI和pymsql
PySimpleGUI 是一个用于简化 GUI 编程的 Python 包,它封装了多种底层 GUI 框架(如 tkinter、Qt、WxPython 等),提供了简单易用的 API。PySimpleGUI 包含了大量的控件(也称为小部件或组件),这些控件可以帮助你快速构建用户界面。是一个用于连接 MySQL 数据库的纯 Python 实现。它允许 Python 程序与 MySQL 数据库进行交互,执行 SQL 查询,并处理结果集。1 准备工作:创建人脸表。
2024-11-06 22:09:13
204
原创 11.5OpenCV_人脸识别
是一个非常流行的 Python 库,专门用于人脸识别任务。它基于 dlib 库和 HOG(Histogram of Oriented Gradients)特征以及深度学习模型,提供了简单易用的接口来进行人脸检测、面部特征点定位和人脸识别。库由 Adam Geitgey 开发,旨在简化人脸识别任务,使其更加容易上手。主要功能人脸检测检测图像中的人脸位置。支持使用 HOG 特征或 CNN(卷积神经网络)进行人脸检测。面部特征点定位检测人脸上的关键特征点(如眼睛、鼻子、嘴巴等)。人脸识别。
2024-11-05 18:37:39
612
原创 11.1OpenCV_图像预处理
在计算机视觉和图像处理领域,图像预处理是一个重要的步骤,它能够提高后续处理(如特征提取、目标检测等)的准确性和效率。
2024-11-01 16:26:50
1358
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人