
计算机视觉CV
文章平均质量分 95
橙子小哥的代码世界
认真在做知识分享
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【深度学习CV】【图像分类】从CNN(卷积神经网络)、ResNet迁移学习到GPU高效训练优化【案例代码】详解
本文详细介绍了三种不同的方法来训练卷积神经网络进行 CIFAR-10 图像分类任务,帮助读者从零开始学习如何设计和优化深度学习模型。首先,我们通过手工设计一个卷积神经网络并进行训练,讲解每个层次的作用和设计思想;接着,我们使用一个开源模型 ResNet34,并对其进行微调以适应我们的数据集;最后,我们通过一系列高效的训练技巧,显著提高训练效率,减少训练时间。最终,您将不仅能实现这一目标,而且能够举一反三,设计自己的模型,提升模型效率。原创 2025-03-06 00:00:16 · 1264 阅读 · 0 评论 -
【计算机视觉CV-图像分类】06 - VGGNet的鲜花分类实现:从数据预处理到模型优化的完整实战
VGGNet由牛津大学视觉几何组(Visual Geometry Group, VGG)和Google DeepMind的研究人员于2014年共同开发。VGGNet在2014年ImageNet大规模视觉识别挑战赛(ILSVRC2014)中表现优异,尤其在图像分类任务中取得了显著的成绩。假设我们使用的是一个包含五类鲜花的图像数据集,每类约有100张图像。数据集分为训练集和验证集,分别存放在不同的文件夹中。利用预训练模型:加速训练过程,提升初始性能。数据增强:增加数据多样性,提升模型泛化能力。学习率调度。原创 2024-12-21 23:59:12 · 1361 阅读 · 0 评论 -
【计算机视觉基础CV-图像分类】05 - 深入解析ResNet与GoogLeNet:从基础理论到实际应用
随着深度神经网络层数的增加,模型的表达能力显著提升。然而,网络越深,训练过程中面临的梯度消失、梯度爆炸等问题也愈加严重,导致模型性能难以进一步提升。2015年,何凯明等人提出了残差网络(ResNet),通过引入“跳跃连接”(Shortcut Connections)有效缓解了深层网络训练中的退化问题,使得训练超过百层的深度网络成为可能。ResNet在2015年的ImageNet图像识别挑战赛中取得了显著成绩,极大地影响了后续深度神经网络的设计。GoogLeNet。原创 2024-12-21 00:04:25 · 1506 阅读 · 0 评论 -
【计算机视觉基础CV-图像分类】04 - 手把手教你实现AlexNet:卷积神经网络的里程碑及其实现,全面掌握图像分类的深度学习经典
在计算机视觉领域,深度学习的崛起是一个划时代的事件。回顾深度学习在图像识别方面的辉煌历程,就不能不提到AlexNet这座里程碑式的模型。2012年,Alex Krizhevsky等人提出的AlexNet在ImageNet竞赛中横空出世,将图像分类的Top-5错误率从近25%一下子拉低到16%左右,远超传统手工特征与浅层模型的表现。这一突破性进展引发了后续一系列深度卷积神经网络(CNN)的繁荣发展,从而开启了计算机视觉研究的新纪元。AlexNet架构图。原创 2024-12-20 01:02:29 · 1201 阅读 · 0 评论 -
【计算机视觉基础CV-图像分类】03-深度学习图像分类实战:鲜花数据集加载与预处理详解
在计算机视觉的深度学习实践中,数据加载和预处理是至关重要的一步。无论你是初学者,还是有一定经验的从业者,都需要深刻理解如何将原始数据转化为神经网络可接受的输入。PyTorch中的和为我们提供了极大的便利,使图像数据的加载和处理更加高效与简洁。本文将以“鲜花分类数据集”(一个包含5种不同花卉类别的图像数据集)为例,详细讲述如何使用类进行数据加载,并通过transforms对图像进行预处理和数据增强。我们还会深入讨论数据集结构、训练/验证集划分、代码注释和实践建议,并给出超过3000字的详细说明。原创 2024-12-19 13:02:10 · 1493 阅读 · 0 评论 -
【计算机视觉基础CV-图像分类】02-入门详解图像分类、经典数据集、比赛与冠军图像模型演进史
图像分类是计算机视觉中最基础、最常见的任务之一。给定一张输入图像,任务是从预定义的类别集合中选择与该图像最匹配的一个或多个类别标签。举例:假设类别集为,当我们给模型一张熊猫的图片,模型需要通过特征提取与分析,最终给出各类别的概率(如dog:1%,cat:4%,panda:95%),并根据最高概率选择“panda”作为标签,即完成了图像分类任务。与目标检测、图像分割等其他计算机视觉任务相比,图像分类的要求更“粗”一些,它不关心物体在图中的位置和像素级轮廓,只需判断图中出现了什么。原创 2024-12-19 11:17:48 · 1859 阅读 · 0 评论 -
【计算机视觉基础CV-图像分类】01- 从历史源头到深度时代:一文读懂计算机视觉的进化脉络、核心任务与产业蓝图
图像分类(Classification):单一对象类别识别,不关心位置。分类+定位(Classification+Localization):单一对象类别识别并给出位置框。目标检测(Object Detection):多个对象的分类与定位。语义分割(Semantic Segmentation):按像素级别对图中每个区域进行类别分类,不区分同类物体的实例。实例分割(Instance Segmentation):像语义分割一样按像素分割,但进一步区分相同类别物体的不同实例。原创 2024-12-19 10:25:16 · 3354 阅读 · 0 评论