- 博客(21)
- 收藏
- 关注
原创 第P10周:Pytorch实现车牌识别
如果数据集无法分类(如无标签或结构混乱),可以自定义数据加载方式,并用预训练模型(如 ResNet)提取图像特征,再进行聚类或可视化分析,实现识别与分类辅助。注明:数据还没跑完,但先存档。
2025-04-13 01:38:08
662
原创 第P9周:YOLOv5-Backbone模块实现
用YOLOv5算法中的Backbone模块搭建网络,在 YOLOv5 中,Backbone 模块主要负责提取图像的基础特征信息,为后续检测任务打好基础。YOLOv5 通常采用 CSPDarknet53 作为主干网络,该结构结合了跨阶段部分连接(CSP)与残差模块(ResBlock),有效增强了网络的表达能力与计算效率。这些设计使得 YOLOv5 的 Backbone 既高效又轻量,非常适合实时目标检测任务。1.Focus层:对输入图像进行切片和通道融合,提高感受野;3.CSP模块:优化梯度流和参数量;
2025-04-04 18:09:57
336
原创 第P8周:YOLOv5-C3模块实现
本文中利用YOLOv5算法中的C3模块搭建网络,其中C3是 YOLOV5中的改进版 CSP 结构,主要用于特征提取和计算优化。它将输入特征分为两部分,一部分直接跳过,另一部分通过多个 Bottleneck结构进行深度处理,最后进行拼接并通过 1*1卷积融合信息。这样可以减少计算量,同时增强特征表达,提高目标检测的精度和效率。
2025-03-28 21:44:00
259
原创 第P7周:马铃薯病害识别(VGG-16复现)
使用 torchsummary,可以查看模型的参数量以及相关指标,查看到各层的参数数量、输出形状、总参数量、可训练参数。
2025-03-20 19:18:40
163
原创 第P6周:VGG-16算法-Pytorch实现人脸识别
本周新学习了VGG-16,它由16个卷积层和3个全连接层组成,因此具有相对较深的网络结构。这种深度有助于网络学习到更加抽象和复杂的特征。VGG-16在卷积层之后接有3个全连接层,最后一个全连接层输出与类别数相对应的向量,用于进行分类。
2025-03-08 08:25:26
230
原创 第P5周:Pytorch实现运动鞋识别
等间隔动态调整方法,每经过step_size个epoch,做一次学习率decay,以gamma值为缩小倍数。函数原型是torch.optim.lr_scheduler.StepLR(optimizer, step_size, gamma=0.1, last_epoch=-1)本文使用了 torch.optim.lr_scheduler.StepLR。
2025-02-28 16:10:46
163
原创 第P4周:猴痘病识别
torch.squeeze(input, dim=None, *, out=None)函数是对数据的维度进行压缩,去掉维数为1的的维度。torch.unsqueeze(input, dim)是对数据维度进行扩充。给指定位置加上维数为一的维度。
2025-02-20 15:55:21
276
原创 第P3周:Pytorch实现天气识别
使用 PyTorch 进行天气分类,主要步骤包括数据预处理、CNN 模型构建、训练、测试、可视化。最终,模型在 20 轮后达到 95.2% 训练集准确率和 92.9% 测试集准确率,效果较好。
2025-02-14 21:10:28
213
原创 第P2周:CIFAR10彩色图片识别
编写完整的 CIFAR-10 彩色图片识别程序步骤包括:导入 PyTorch 和 torchvision,并加载 CIFAR-10 数据集。接着,构建卷积神经网络 (CNN),包括卷积层、激活函数、池化层和全连接层,并选择合适的损失函数(如交叉熵损失)和优化器(如 Adam)。随后,编写训练和验证函数,在训练中使用 model.train() 和优化器更新参数,在验证中使用 model.eval() 评估模型性能。最后,通过绘制损失和准确率曲线来可视化训练效果,完成模型保存和预测。
2025-01-21 23:27:02
244
原创 第P1周 :PyTorch 实现MNIST 手写数字识别
本文使用PyTorch完成MNIST 手写数字识别任务的基础架构准备工作,包括数据加载、模型定义、设备选择和模型摘要展示。引入了 torch, torchvision, 以及相关模块(如 torch.nn、torchinfo 等)。torchinfo 用于查看模型的结构和参数信息。
2025-01-17 22:06:43
175
原创 第T10周数据增强
数据增强是机器学习中用来扩充训练数据集的技术,目的是通过创建数据的变体来模拟更多的训练样本,从而提高模型的泛化能力和减少过拟合。本周学习了两种数据增强方法,一是将数据增强模块嵌入model中,二是在Dataset数据集中进行数据增强。方法二:在dataset数据集中进行数据增强。增强方式一:将其嵌入model中。
2024-12-20 15:26:50
247
原创 T9猫狗识别2
将K.set_value(model.optimizer.lr, lr)的报错,改为model.optimizer_learning_rate=lr。构建VGG-16网络。
2024-12-13 21:53:51
599
原创 第T8周:猫狗识别
Bug:K.set_value(model.optimizer.lr, lr)报错,改为optimizer.learning_rate.assign(lr)x:输入数据,可以是一个 NumPy 数组,形状为 (batch_size, …1.model.train_on_batch() 是 Keras 中的一个函数,用于在单个批次的数据上训练模型。2.TQDM 是一个快速、可扩展的 Python 进度条库,可以在长循环中添加一个进度提示信息。y:目标数据(标签),形状应与模型的输出一致。
2024-12-07 06:54:19
1052
原创 第T7周:咖啡豆识别
结构简单:使用连续的小卷积核(3×3)堆叠,便于理解和实现。特征表达强:深层网络捕获高质量特征,对视觉任务表现出色。迁移学习效果好:预训练模型广泛用于其他任务,效果优秀。cache() :将数据集缓存到内存当中,加速运行。梯度消失风险:网络较深,容易出现梯度消失问题。prefetch() :预取数据,加速运行,参数量大:权重较多,训练和存储成本高。计算量大:推理速度慢,对硬件要求较高。1.shuffle() :打乱数据,构建VGG-16网络。
2024-11-22 09:10:38
659
原创 第T6周:好莱坞明星识别
sparse_categorical_crossentropy也用于多分类问题,但标签为整数编码形式。EarlyStopping:若 val_accuracy 在20个epoch内不再提升,且变化小于 min_delta=0.001,则停止训练。ModelCheckpoint:在 val_accuracy 提升时保存模型,文件名为 best_model.keras。本文使用的categorical_crossentropy用于多分类问题,当标签是 one-hot 编码格式时使用。
2024-11-14 14:18:11
785
原创 第T5周:运动鞋品牌识别
本周进行了运动鞋品牌识别的练习,这是一个经典的图像分类问题,通过深度学习技术能够有效地对运动鞋品牌进行识别。此外,学习了学习率大与学习率小的优缺点对比,○ 2、单单使用大学习率容易导致模型不精确。○ 1、有助于模型收敛、模型细化。○ 2、有助于跳出局部最优值。○ 1、导致模型训练不收敛。○ 1、很难跳出局部最优值。○ 1、加快学习速率。○ 2、提高模型精度。
2024-11-08 16:04:00
709
原创 第T4周:猴痘病识别
本周练习是通过构建卷积神经网络(CNN)来识别猴逗病。本周使用了卷积神经网络(CNN)进行图像分类,利用 TensorFlow 和 Keras 框架进行模型构建和训练。多个卷积层、平均池化层和Dropout层组成的网络结构,可以提取特征并防止过拟合。最终,输出层设置为两个节点以区分“Monkeypox”和“Others”类。
2024-10-30 18:10:13
1000
原创 第T3周:天气识别
本周我使用TensorFlow构建卷积神经网络(CNN),对天气图片进行分类。本周的过程包括数据集的加载、预处理、模型构建、训练以及评估。通过数据预处理与模型调优,我达到较高的训练准确率和验证准确率。从图中可以看出,模型在训练过程中,训练集的准确率和验证集的准确率都在逐渐提升,并且验证集的损失值逐渐收敛,说明模型的表现较为稳健。训练集包含900张图片,验证集包含225张图片,所有图片被均匀地划分为4类。
2024-10-18 22:47:27
745
原创 第T2周:彩色图片分类
彩色图片和灰度图片在颜色表示和数据存储方式上存在显著差异。彩色图像是指RGB图像,三个颜色通道来描述每个像素的颜色,适用于照片、视频这类需要丰富色彩信息的场景。而灰度图像只有一个颜色通道,用于显示黑白照片或降低存储和传输成本。
2024-10-11 14:46:42
968
原创 第T1周:实现mnist手写数字识别
第一周跑通了代码,也尽力理解了每一行代码的运行逻辑。以下是尝试运行代码的过程。● 深度学习环境:TensorFlow 2.17.0。本文为[365天深度学习训练营]中的学习记录博客。● 语言环境:Python 3.12.6。第T1周:实现mnist手写数字识别。● 编译器:jupyter lab。二、构建CNN网络模型。原作者:[K同学啊]
2024-10-04 00:15:11
919
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人