
Pytorch理论+实践
文章平均质量分 88
记录Pytorch理论知识+项目
那年一路北
记录日常,感谢关注。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
利用Torchvision中Mask-RCNN实现实例分割
import osboxes = []target = {我分析了Mask-RCNN模型的架构,从Mask-RCNN模型的原理出发,结合PyTorch实现了对象检测与实例分割的完整流程,包括模型构建、自定义数据集、模型训练及预测可视化。原创 2025-01-15 15:57:59 · 1683 阅读 · 2 评论 -
PyTorch 框架 CV 开发:从数据处理到模型部署与可视化
PyTorch 中的数据处理是模型训练的基础,包提供了一系列用于数据加载和处理的工具。其中,Dataset是一个数据抽象类,它支持两种风格的数据表示:Map-style 和 Iterable-style。Map-style 数据集:需实现和__len__方法。方法根据索引idx获取数据集中的样本,通过访问即可获取对应的数据样本;__len__方法则返回数据集的大小。这种风格适用于可以通过索引快速访问的数据,如图片数据集,每个图片都有对应的索引,方便获取。Iterable-style 数据集。原创 2025-01-18 07:00:00 · 884 阅读 · 0 评论 -
基于 Pytorch 的全卷积网络人脸表情识别:从数据到部署的实战之旅
除了公开数据集,我们还可以创建自己的自定义表情数据集。本次使用的自定义表情数据集包含 4300 张人脸表情图像,涵盖了八种表情类别,分别是 ["neutral", "anger", "disdain", "disgust", "fear", "happy", "sadness", "surprise"],图像大小均为 64x64。import os# 示例用法data_dir = "your_data_dir" # 替换为实际数据集路径])上述代码首先定义了一个类,继承自Dataset类。在。原创 2025-01-16 12:33:52 · 1341 阅读 · 0 评论 -
深度学习基础:自动梯度、线性回归与逻辑回归的 PyTorch 实践
本文介绍了深度学习中的自动梯度、线性回归和逻辑回归的原理与 PyTorch 实现。自动梯度为深度学习模型的训练提供了高效的计算方法,线性回归和逻辑回归分别适用于数值预测和分类问题。通过掌握这些基础知识,可以为深入学习更复杂的深度学习模型和算法奠定坚实的基础。在实际应用中,可以根据具体问题的需求,灵活运用这些方法,并进一步优化模型,以实现更好的性能。原创 2025-01-16 14:50:25 · 1033 阅读 · 0 评论 -
使用Torchvision框架实现对象检测:从Faster-RCNN模型到自定义数据集,训练模型,完成目标检测任务。
输入图像# 推理# 可视化结果plt.show()Pascal VOC:以XML文件存储标注信息。MS COCO:以JSON文件存储标注信息。为了使用自定义数据集,需继承__len__:返回数据集大小。:返回单个样本的数据和标注。import osboxes = []labels.append(1) # 假设只有一个类。原创 2025-01-15 15:34:25 · 869 阅读 · 0 评论 -
PyTorch 基础数据集:从理论到实践的深度学习基石
下面演示如何加载自定义的图像数据集。原创 2025-01-17 10:59:52 · 1544 阅读 · 0 评论 -
利用ResNet18实现缺陷图像分类的训练与部署
ResNet18是ResNet家族中的一员,其网络结构深度适中,适合在小型数据集上快速收敛。ResNet通过引入“残差模块”解决了深度网络中梯度消失的问题,是深度学习图像分类的经典模型之一。本文中使用的数据集是NEU表面缺陷数据库,包含6种类型的表面缺陷图像:夹杂、划痕、压入、氧化皮、裂纹、麻点和斑块。通过ResNet18,我们可以高效完成缺陷图像的分类任务。模型训练阶段强调数据的预处理和网络结构的调整,而部署阶段则注重模型格式的转换与推理框架的选择。优化模型性能:通过迁移学习或调优超参数提高模型精度。原创 2025-01-15 14:45:26 · 703 阅读 · 0 评论 -
U-Net模型结构与语义分割道路裂纹项目
U-Net是一种非常经典且广泛应用于图像分割任务的卷积神经网络(CNN)。最早由Olaf Ronneberger等人在2015年提出,U-Net专为生物医学图像的语义分割设计,尤其擅长处理具有少量标注数据的分割任务。它的名称来源于其具有U形对称结构的网络架构。U-Net结构的独特之处在于采用了编码器(Contracting Path)和解码器(Expansive Path)相结合的方式,通过跳跃连接(skip connection)有效保留了高分辨率的特征。下面详细介绍U-Net的模型结构。原创 2025-01-14 19:34:49 · 1958 阅读 · 0 评论 -
基于残差网络的车辆属性识别:从数据到部署的全流程实践
本次使用的车辆数据集为 BIT-Vehicle Dataset,该数据集包含 6 种车辆类型,共计 9850 张图像,数据集中的 VehicleInfo.mat 文件存储了车辆的相关信息。这个数据集为我们的车辆属性识别任务提供了丰富的样本基础。学习残差网络的要义,记录使用残差网络实现车辆属性识别的过程,包括车辆数据集的准备、模型的设计与训练以及模型在 OpenVINO 中的部署与预测。深入理解这一技术的实现原理和应用方法。原创 2025-01-16 14:09:12 · 1180 阅读 · 0 评论 -
PyTorch迁移学习与指南框架
迁移学习(Transfer Learning)是深度学习中的一个重要概念,它主要应用于相同或相似的任务。在实际应用中,我们经常会遇到数据规模较小的情况,这使得从头开始训练一个模型变得困难。迁移学习通过重用模型的特征提取部分,然后对模型的最后几层进行微调,从而在小规模数据集上快速提升模型性能。原创 2025-01-15 14:37:12 · 1171 阅读 · 0 评论 -
图像语义分割概念与上采样技术详解
图像语义分割技术的核心在于像素级分类,这一过程需要高效的网络架构与上采样技术的支持。从经典的FCN到更为先进的PSPNet,各类网络在性能与效率之间不断取得平衡。而在上采样过程中,直接插值、反卷积和Unpooling等技术各有优劣,适合不同的应用场景。延伸阅读深入理解卷积神经网络(CNN)的工作原理。探索语义分割任务在自动驾驶中的具体应用。学习优化反卷积过程以减轻棋盘效应的影响。原创 2025-01-14 16:06:43 · 503 阅读 · 0 评论 -
PyTorch 卷积神经网络全解析:从原理到实践
卷积是一种数学运算,在信号处理、图像处理等领域有着广泛的应用。在深度学习中,卷积操作是卷积神经网络的核心组成部分。简单来说,卷积可以理解为 “输入 + 脉冲 = 输出”,其运算过程包括翻转、移位、相乘和相加。以一维离散卷积为例,假设有输入序列 [2, 3, 0, 5, 6, 7, 1, 8, 2, 9, 0] 和卷积核 [1, 1, 1],计算过程如下:通过这样的计算,卷积操作可以提取输入数据中的特征。原创 2025-01-17 11:37:19 · 965 阅读 · 0 评论 -
深度解析人工神经网络:信息流动、训练挑战与优化策略
人工神经网络的迅猛发展推动了深度学习在各个领域的应用,尤其是在计算机视觉、自然语言处理等任务中取得了巨大的突破。原创 2025-01-17 07:00:00 · 872 阅读 · 0 评论