- 博客(106)
- 资源 (2)
- 收藏
- 关注
原创 一些基本图像预处理---将一个文件中的所有图片进行尺度归一化、查看每个像素的RGB值,将指定颜色切换为白色、将文件中所有图片从png到jpg的切换
一些基本图像预处理---将一个文件中的所有图片进行尺度归一化、查看每个像素的RGB值,将指定颜色切换为白色、将文件中所有图片从png到jpg的切换
2023-10-24 19:54:13
399
原创 如何成功安装Node.js并在VS Code终端使用npm
npm 无法将“npm”项识别为 cmdlet、函数、脚本文件或可运行程序的名称。请检查名称的拼写,如果包括路径,请确保路径正确,然后再试一次。
2023-10-14 15:51:48
6244
1
原创 WARNING:tensorflow:Your input ran out of data; interrupting training. 解决方法
WARNING:tensorflow:Your input ran out of data; interrupting training. Make sure that your dataset or generator can generate at least steps_per_epoch * epochs batches (in this case, 13800 batches). You may need to use the repeat() function when building you
2023-09-26 19:21:38
1355
原创 什么是patch?
定义:Patch是图像的一个子区域,它可以是正方形或矩形,并且具有固定的尺寸。通常情况下,这些尺寸是预定义的,并作为CNN的超参数进行设置。Patch的大小可以根据具体任务和数据集的要求进行调整。
2023-08-12 10:47:51
6244
原创 深入浅出R-CNN:一种深度学习目标检测方法
R-CNN是一种基于区域的卷积神经网络(CNN)方法,用于检测和分类图像中的对象。它由Ross Girshick等人于2014年提出,旨在解决传统滑动窗口方法的一些缺点,如计算复杂度高和难以处理尺度变化等问题。R-CNN的核心思想是在输入图像中生成潜在的目标区域(即候选区域),然后使用卷积神经网络对这些区域进行特征提取和分类。这种方法大大减少了计算成本,并且能够在具有挑战性的数据集上实现高精度目标检测。
2023-07-12 14:25:58
419
原创 人脸表情识别
使用fer2013数据集,包含35887张48×48像素的灰度人脸图像,按照比例关系,将其中的28709张图片放进训练集中,将其中的3589张图片放进测试集中,还剩下最后的3589张图片放进验证集中。
2023-07-08 15:20:23
758
原创 图像增广:强化深度学习的视觉表现力
图像增广(Image Augmentation)是一种通过对原始图像进行各种变换来生成新的图像的方法。这些变换包括旋转、翻转、缩放、剪切、色彩变换等。通过图像增广,我们可以扩大数据集的规模,增加模型训练时的输入样本。这有助于提高模型的泛化能力,从而在面对新的、未知的数据时,也能达到较高的准确性。
2023-07-06 14:45:15
2557
原创 批量规范化
神经网络的发展正朝着越来越大,越来越深的地方发展,更深层的网络很复杂,容易过拟合。 这意味着正则化变得更加重要。批量规范化应用于单个可选层(也可以应用到所有层)批量规范化是一种流行且有效的技术,可持续加速深层网络的收敛速度,但一般不改变模型精度。批量规范化应用于单个可选层(也可以应用到所有层),其原理如下:在每次训练迭代中,我们首先规范化输入,即通过减去其均值并除以其标准差,其中两者均基于当前小批量处理。
2023-07-05 15:25:48
668
原创 ResNet:深度学习中的重要里程碑
首先是什么是残差块:让我们聚焦于神经网络局部:如图所示,假设我们的原始输入为x。左图虚线框中的部分需要直接拟合出该映射f(x),而右图虚线框中的部分则需要拟合出残差映射f(x)−x。残差映射在现实中往往更容易优化。右图是ResNet的基础架构–残差块在残差块中,输入可通过跨层数据线路更快地向前传播。ResNet的核心结构是残差块(residual block),由两个或三个卷积层组成。每个残差块包含了跳跃连接(skip connection),将输入直接传递给输出。
2023-07-02 15:37:23
1419
原创 神经网络之VGG
经典卷积神经网络的基本组成部分是下面的这个序列:带填充以保持分辨率的卷积层;非线性激活函数,如ReLU;汇聚层,如最大汇聚层。而一个VGG块与之类似,由一系列卷积层组成,后面再加上用于空间下采样的最大汇聚层。在最初的VGG论文中 (),作者使用了带有3×3卷积核、填充为1(保持高度和宽度)的卷积层,和带有2×2汇聚窗口、步幅为2(每个块后的分辨率减半)的最大汇聚层。VGG的全称是视觉几何小组,隶属于牛津大学科学与工程系。
2023-07-01 15:56:34
4668
1
原创 深度卷积神经网络(AlexNet)
2012年,AlexNet横空出世。它首次证明了学习到的特征可以超越手工设计的特征。它一举打破了计算机视觉研究的现状。AlexNet使用了8层卷积神经网络,并以很大的优势赢得了2012年ImageNet图像识别挑战赛。AlexNet并不是第一个赢得图像识别竞赛的GPU实现的高速卷积神经网络。
2023-06-30 19:02:02
401
原创 LeNet基础
LeNet(LeNet-5)是历史上第一个成功应用于数字识别任务的卷积神经网络模型。由于其优秀的表现和先进的结构被广泛认可,成为深度学习的里程碑之一。LeNet由加拿大籍计算机科学家Yann LeCun在1998年提出,旨在解决手写数字识别问题。它是第一个能够通过卷积层和池化层实现特征提取和降维的卷积神经网络模型。LeNet-5模型的架构包含6层,包括2个卷积层、2个池化层和2个全连接层。LeNet-5的主要优点是它非常高效,具有一定的鲁棒性,并且在处理小尺寸图像时表现出色。
2023-06-29 16:54:17
1235
原创 torch.stack()的使用
必须介于 0 和数字之间 级联张量的维数(包括)连接起来,构造了一个具有3个输出通道的卷积核。即可以将多个低纬张量拼凑为一个高维张量。inputs : 待连接的张量序列。1.2.1沿新维度连接一系列张量。1.2.2所有张量的大小必须相同。用来实现一个计算多个通道的输出。dim : 新的维度, 必须在。是生成数据的维度大小,也就是。) – 要连接的张量序列。
2023-06-28 15:09:20
514
原创 如何在pycharm上安装tensorflow
如何在pycharm上安装tensorflow?安装tensorflow是真的费劲,本次仔细,全面的将整个过程展现出来,小白也能配好!!!
2022-12-30 20:21:43
25196
5
原创 GUI 图形用户界面编程(十四)OptionMenu-情人节你最希望女友穿什么
GUI 图形用户界面编程(十四)OptionMenu-情人节你最希望女友穿什么
2022-02-14 10:44:21
1345
1
原创 GUI 图形用户界面编程(八)选择界面-当女友穿上女仆装,你是选择接着改bug还是要去......
GUI 图形用户界面编程(八)选择界面-当女友穿上女仆装,你是选择接着改bug还是要去......关于Checkbutton 复选按钮的基本用法。
2022-02-07 16:54:38
2189
8
原创 GUI 图形用户界面编程(七)-女友生气,你是选择亚索还是女友?
GUI 图形用户界面编程(七)-女友生气,你是选择亚索还是女友?是我选择亚索了!
2022-02-06 11:43:47
1451
3
大数据处理课程设计论文:基于机器学习的酒店预定分析
2022-12-28
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人