- 博客(13)
- 问答 (1)
- 收藏
- 关注
原创 j2:基于pytorch的resnet实验:鸟类分类
通过本次实验,我们深入理解了 ResNetV2 相较于 ResNetV1 的改进之处,尤其是预激活的设计如何提升深层网络的梯度传播效率。对于今后的任务,可以考虑在更深层的网络上使用 ResNetV2 以提高稳定性,特别是在需要更深层结构(如 ResNet-101、ResNet-152)时,V2 的优势会更加明显。ResNetV2使用了预激活结构,梯度直接通过批归一化和残差连接传播到前面的层,这样可以更好地保持梯度流动,特别是在非常深的网络中性能表现优越。实现了完整的 ResNet50V2 架构。
2024-08-16 22:01:04
729
1
原创 j1:基于resnet的鸟类图片分类实验(pytorch版本)
传统的深度神经网络随着层数的加深,容易出现模型的退化问题,即随着网络层数的增加,模型的性能不仅没有提升,反而可能下降。具体来说,它通过引入“残差块”(Residual Block),使得网络的某一层不仅学习当前层的输出,还通过跳跃连接(shortcut connection)直接将输入传递给后面的层,这种直接连接被称为“跳跃连接”或“捷径”。ResNet的提出解决了深层神经网络中存在的梯度消失和梯度爆炸问题,使得构建非常深的神经网络成为可能,网络的深度从传统的几十层增加到了上百层甚至更深。
2024-08-09 21:58:58
1220
原创 week9:实现YOLOv5-backbone模块实验
本文将重点介绍Backbone模块。例如,将一个3x3的卷积核的步长从1改为2,同时将输入特征图的分辨率缩小一半,但通道数增加到原来的四倍。BottleneckCSP模块是CSPNet的核心,它将输入特征图分为两部分,一部分经过卷积操作,另一部分直接通过,并在最后进行融合。本次实验让我大概理解了Backbone模块的设计理念和实现细节,可以更好地理解YOLOv5整体架构的高效性和先进性,以及在对象检测中的应用效果。输出特征图:通过这些层的变换,最终生成高维度的特征图,供后续的Neck和Head模块使用。
2024-07-12 21:32:13
1215
原创 week8:实现YOLOv5-C3模块实验
YOLOv5 是 YOLO 系列的一个改进版本,具有更高的精度和更快的速度。YOLOv5 使用了 Path Aggregation Network (PANet),它能够结合来自不同尺度的特征,从而提高检测精度。Head:用于生成最终的检测结果,包括目标的边界框和类别预测。易用性:YOLOv5 提供了详细的文档和教程,便于用户进行训练和部署。此外,它支持多种框架,如 PyTorch 和 ONNX。本次实验让我对yolov5有了最基本的认识,也发现通过这段时间的学习,我对此类代码的读,写能力都有所增强。
2024-07-05 18:17:57
1144
原创 week7:马铃薯病害识别(VGG-16复现)
在本实验中,成功复现了VGG-16模型,并应用于土豆病毒图片的识别任务。通过搭建前馈神经网络,深入理解了卷积层和池化层的作用及其在图像特征提取中的重要性。使用卷积层提取图片的低级和高级特征,并通过池化层进行特征降维,有效减少了计算量并提升了模型的泛化能力。实验结果表明,经过训练的VGG-16模型在土豆病毒图片的分类任务中表现优异,验证了卷积神经网络在图像识别领域的强大能力。预测结果是:Early_blight。
2024-06-28 21:53:16
1232
1
原创 week6:VGG-16算法-Pytorch实现人脸识别实验
使用多个3x3的小卷积核而不是大卷积核,这样可以增加网络的深度,提高模型的表达能力,同时减少参数量。第2段:两个3x3卷积层(128个过滤器),后接一个2x2最大池化层(stride为2)。第3段:三个3x3卷积层(256个过滤器),后接一个2x2最大池化层(stride为2)。第4段:三个3x3卷积层(512个过滤器),后接一个2x2最大池化层(stride为2)。第5段:三个3x3卷积层(512个过滤器),后接一个2x2最大池化层(stride为2)。
2024-06-14 21:57:21
585
原创 基于pytorch的运动鞋识别实验
在实际应用中,很多预训练的深度学习模型(例如 ResNet、VGG 等)都是在 ImageNet 数据集上训练的。加速模型训练:标准化可以使数据的每个维度具有相同的尺度,从而加快梯度下降法的收敛速度。保证一致性:使用与预训练模型相同的均值和标准差,可以确保你的数据和预训练数据具有相同的分布,从而提高模型在迁移学习中的性能和稳定性。提高模型性能:未经标准化的数据可能导致不同特征值范围过大,从而影响模型的性能。选择使用以下代码对指定的adidas分类中的图片预测检查模型性能,可以发现模型成功预测。
2024-06-07 21:53:57
975
原创 第四周:基于pytorch的猴痘识别实验
选择卷积核的大小(kernel_size)是设计卷积神经网络(CNN)时的重要步骤,通常根据任务的需求和数据的特性来选择。对于一般的CNN网络来说,都是由特征提取网络和分类网络构成,其中特征提取网络用于提取图片的特征,分类网络用于将图片进行分类。优点: 通过堆叠多个小卷积核(例如连续的 3x3 卷积层)可以获得更深的感受野,同时参数量相对较少。在训练过程中,记录每个epoch的测试集准确率,并保存在每个epoch中测试集准确率最高的模型参数。增加网络宽度:增加卷积核的数量或者全连接层的神经元数量。
2024-05-31 21:49:34
805
原创 week2: 基于pytorch的CIFAR10彩色图片识别实验
CNN 的核心是卷积层和池化层,通过局部感知和参数共享来提取图像特征。大致了解到卷积层利用卷积操作提取特征,包括滤波器的定义、特征图的计算等。CNN 的核心是卷积层和池化层,通过局部感知和参数共享来提取图像特征。大致了解到卷积层利用卷积操作提取特征,包括滤波器的定义、特征图的计算等。卷积池化的推导:卷积操作是将滤波器与输入图像进行卷积运算,通过滑动窗口计算特征图。池化操作是将特征图进行降采样,常用的池化方式包括最大池化和平均池化。实验涉及到数据集的准备、模型构建、训练、评估和结果分析等多个步骤。
2024-05-17 21:07:53
1094
原创 基于pytorch的MNIST数字识别实验
nn.Linear为全连接层,可以起到特征提取器的作用,最后一层的全连接层也可以认为是输出层,传入参数为输入特征数和输出特征数(输入特征数由特征提取网络计算得到,如果不会计算可以直接运行网络,报错中会提示输入特征数的大小,下方网络中第一个全连接层的输入特征数为1600)对于一般的CNN网络来说,都是由特征提取网络和分类网络构成,其中特征提取网络用于提取图片的特征,分类网络用于将图片进行分类。nn.Conv2d为卷积层,用于提取图片的特征,传入参数为输入channel,输出channel,池化核大小。
2024-05-10 21:46:38
936
1
原创 对“小猿搜题”教育软件的作用分析
众所周知,现在的中小学生有很重的课业负担,学习内容多,常常会遇到难题,而小猿搜题能够有效的帮助解决问题。小猿搜题是一款为中小学生创造的拍照搜题软件,软件操作简单,功能强大,通过手机拍题来解答,是一款非常优秀的教学工具。在这里,我们对其教育资源信息化及作用思路进行一些分析。一丶简易的操作,丰富的资源。进入小猿搜题,软件的主题便占了几乎整个屏幕,给了使用者很大的便利,提高效率。另外,不得不提的...
2018-11-16 12:55:21
11238
空空如也
提问,C++字符串与字符转换问题
2023-03-07
下载了au2019,安装au时打开只有au大图标和选项跟安装两行文字,点击击不了? 如图
2019-12-18
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅