自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

2405_87523719的博客

原创第P10周：Pytorch实现车牌识别

如果数据集无法分类（如无标签或结构混乱），可以自定义数据加载方式，并用预训练模型（如 ResNet）提取图像特征，再进行聚类或可视化分析，实现识别与分类辅助。注明：数据还没跑完，但先存档。

2025-04-13 01:38:08 662

原创第P9周：YOLOv5-Backbone模块实现

用YOLOv5算法中的Backbone模块搭建网络，在 YOLOv5 中，Backbone 模块主要负责提取图像的基础特征信息，为后续检测任务打好基础。YOLOv5 通常采用 CSPDarknet53 作为主干网络，该结构结合了跨阶段部分连接（CSP）与残差模块（ResBlock），有效增强了网络的表达能力与计算效率。这些设计使得 YOLOv5 的 Backbone 既高效又轻量，非常适合实时目标检测任务。1.Focus层：对输入图像进行切片和通道融合，提高感受野；3.CSP模块：优化梯度流和参数量；

2025-04-04 18:09:57 336

原创第P8周：YOLOv5-C3模块实现

本文中利用YOLOv5算法中的C3模块搭建网络，其中C3是 YOLOV5中的改进版 CSP 结构，主要用于特征提取和计算优化。它将输入特征分为两部分，一部分直接跳过，另一部分通过多个 Bottleneck结构进行深度处理，最后进行拼接并通过 1*1卷积融合信息。这样可以减少计算量，同时增强特征表达，提高目标检测的精度和效率。

2025-03-28 21:44:00 259

原创第P7周：马铃薯病害识别（VGG-16复现）

使用 torchsummary，可以查看模型的参数量以及相关指标，查看到各层的参数数量、输出形状、总参数量、可训练参数。

2025-03-20 19:18:40 163

原创第P6周：VGG-16算法-Pytorch实现人脸识别

本周新学习了VGG-16，它由16个卷积层和3个全连接层组成，因此具有相对较深的网络结构。这种深度有助于网络学习到更加抽象和复杂的特征。VGG-16在卷积层之后接有3个全连接层，最后一个全连接层输出与类别数相对应的向量，用于进行分类。

2025-03-08 08:25:26 230

原创第P5周：Pytorch实现运动鞋识别

等间隔动态调整方法，每经过step_size个epoch，做一次学习率decay，以gamma值为缩小倍数。函数原型是torch.optim.lr_scheduler.StepLR(optimizer, step_size, gamma=0.1, last_epoch=-1)本文使用了 torch.optim.lr_scheduler.StepLR。

2025-02-28 16:10:46 163

原创第P4周：猴痘病识别

torch.squeeze(input, dim=None, *, out=None)函数是对数据的维度进行压缩，去掉维数为1的的维度。torch.unsqueeze(input, dim)是对数据维度进行扩充。给指定位置加上维数为一的维度。

2025-02-20 15:55:21 276

原创第P3周：Pytorch实现天气识别

使用 PyTorch 进行天气分类，主要步骤包括数据预处理、CNN 模型构建、训练、测试、可视化。最终，模型在 20 轮后达到 95.2% 训练集准确率和 92.9% 测试集准确率，效果较好。

2025-02-14 21:10:28 213

原创第P2周：CIFAR10彩色图片识别

编写完整的 CIFAR-10 彩色图片识别程序步骤包括：导入 PyTorch 和 torchvision，并加载 CIFAR-10 数据集。接着，构建卷积神经网络 (CNN)，包括卷积层、激活函数、池化层和全连接层，并选择合适的损失函数（如交叉熵损失）和优化器（如 Adam）。随后，编写训练和验证函数，在训练中使用 model.train() 和优化器更新参数，在验证中使用 model.eval() 评估模型性能。最后，通过绘制损失和准确率曲线来可视化训练效果，完成模型保存和预测。

2025-01-21 23:27:02 244

原创第P1周：PyTorch 实现MNIST 手写数字识别

本文使用PyTorch完成MNIST 手写数字识别任务的基础架构准备工作，包括数据加载、模型定义、设备选择和模型摘要展示。引入了 torch, torchvision, 以及相关模块（如 torch.nn、torchinfo 等）。torchinfo 用于查看模型的结构和参数信息。

2025-01-17 22:06:43 175

原创 T11优化器对比实验

有结果对比可知，Adam优化器的效果更好。

2025-01-04 11:46:05 1028

原创第T10周数据增强

数据增强是机器学习中用来扩充训练数据集的技术，目的是通过创建数据的变体来模拟更多的训练样本，从而提高模型的泛化能力和减少过拟合。本周学习了两种数据增强方法，一是将数据增强模块嵌入model中，二是在Dataset数据集中进行数据增强。方法二：在dataset数据集中进行数据增强。增强方式一：将其嵌入model中。

2024-12-20 15:26:50 247

原创 T9猫狗识别2

将K.set_value(model.optimizer.lr, lr)的报错，改为model.optimizer_learning_rate=lr。构建VGG-16网络。

2024-12-13 21:53:51 599

原创第T8周：猫狗识别

Bug：K.set_value(model.optimizer.lr, lr)报错，改为optimizer.learning_rate.assign(lr)x：输入数据，可以是一个 NumPy 数组，形状为 (batch_size, …1.model.train_on_batch() 是 Keras 中的一个函数，用于在单个批次的数据上训练模型。2.TQDM 是一个快速、可扩展的 Python 进度条库，可以在长循环中添加一个进度提示信息。y：目标数据（标签），形状应与模型的输出一致。

2024-12-07 06:54:19 1052

原创第T7周：咖啡豆识别

结构简单：使用连续的小卷积核（3×3）堆叠，便于理解和实现。特征表达强：深层网络捕获高质量特征，对视觉任务表现出色。迁移学习效果好：预训练模型广泛用于其他任务，效果优秀。cache() ：将数据集缓存到内存当中，加速运行。梯度消失风险：网络较深，容易出现梯度消失问题。prefetch() ：预取数据，加速运行，参数量大：权重较多，训练和存储成本高。计算量大：推理速度慢，对硬件要求较高。1.shuffle() ：打乱数据，构建VGG-16网络。

2024-11-22 09:10:38 659

原创第T6周：好莱坞明星识别

sparse_categorical_crossentropy也用于多分类问题，但标签为整数编码形式。EarlyStopping：若 val_accuracy 在20个epoch内不再提升，且变化小于 min_delta=0.001，则停止训练。ModelCheckpoint：在 val_accuracy 提升时保存模型，文件名为 best_model.keras。本文使用的categorical_crossentropy用于多分类问题，当标签是 one-hot 编码格式时使用。

2024-11-14 14:18:11 785

原创第T5周：运动鞋品牌识别

本周进行了运动鞋品牌识别的练习，这是一个经典的图像分类问题，通过深度学习技术能够有效地对运动鞋品牌进行识别。此外，学习了学习率大与学习率小的优缺点对比，○ 2、单单使用大学习率容易导致模型不精确。○ 1、有助于模型收敛、模型细化。○ 2、有助于跳出局部最优值。○ 1、导致模型训练不收敛。○ 1、很难跳出局部最优值。○ 1、加快学习速率。○ 2、提高模型精度。

2024-11-08 16:04:00 709

原创第T4周：猴痘病识别

本周练习是通过构建卷积神经网络（CNN）来识别猴逗病。本周使用了卷积神经网络（CNN）进行图像分类，利用 TensorFlow 和 Keras 框架进行模型构建和训练。多个卷积层、平均池化层和Dropout层组成的网络结构，可以提取特征并防止过拟合。最终，输出层设置为两个节点以区分“Monkeypox”和“Others”类。

2024-10-30 18:10:13 1000

原创第T3周：天气识别

本周我使用TensorFlow构建卷积神经网络（CNN），对天气图片进行分类。本周的过程包括数据集的加载、预处理、模型构建、训练以及评估。通过数据预处理与模型调优，我达到较高的训练准确率和验证准确率。从图中可以看出，模型在训练过程中，训练集的准确率和验证集的准确率都在逐渐提升，并且验证集的损失值逐渐收敛，说明模型的表现较为稳健。训练集包含900张图片，验证集包含225张图片，所有图片被均匀地划分为4类。

2024-10-18 22:47:27 745

原创第T2周：彩色图片分类

彩色图片和灰度图片在颜色表示和数据存储方式上存在显著差异。彩色图像是指RGB图像，三个颜色通道来描述每个像素的颜色，适用于照片、视频这类需要丰富色彩信息的场景。而灰度图像只有一个颜色通道，用于显示黑白照片或降低存储和传输成本。

2024-10-11 14:46:42 968

原创第T1周：实现mnist手写数字识别

第一周跑通了代码，也尽力理解了每一行代码的运行逻辑。以下是尝试运行代码的过程。● 深度学习环境：TensorFlow 2.17.0。本文为[365天深度学习训练营]中的学习记录博客。● 语言环境：Python 3.12.6。第T1周：实现mnist手写数字识别。● 编译器：jupyter lab。二、构建CNN网络模型。原作者：[K同学啊]

2024-10-04 00:15:11 919

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示

确定要删除当前文章？

取消删除