视觉进阶篇
文章平均质量分 96
入门后使用
月下倩影时
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
视觉进阶篇——二维码快速识别解码:多方案实现代码(Python与C++)
随着二维码越来越普及,很多竞赛中的子任务都出现了需要快速识别二维码的要求,有些是单纯使用二维码对应某一种类别信息,有的是将信息写入二维码,你需要进行解码获取二维码蕴含的信息从而做出决策和判断。学长这里从原理讲到不同方案的快速解码技术,单纯的二维码识别也可以当做一个目标检测去做。图像采集:通过摄像头捕获包含二维码的图像预处理:增强图像质量,提升识别成功率特征提取与定位:识别二维码位置和方向解码输出:解析二维码编码数据。原创 2025-11-16 23:32:54 · 728 阅读 · 0 评论 -
视觉进阶篇——YOLOv5环境配置与训练评估(很长,请耐心)
从这篇开始我们正式进入基于深度学习的目标检测的领域。现在目标检测的模型非常之多,但是我还是喜欢让大家从yolov5学习,因为简单,并且容易去给大家讲解。从这章开始,将大家一起学习如何根据github上面的说明进行学习,以此抛转引玉,之后大家可以学着学习其他模型。请注意,我并不带大家一点一点吃透yolov5网络模型,这是你自己下去该学习的。根据之前的学习相信你现在应该已经有了以下基础环境忘记步骤的同学到墙边罚站去我们可以在pycharm中看到yolov5的文件夹结构,这时我们找到.md文件,一般来说g原创 2025-11-16 00:04:59 · 379 阅读 · 0 评论 -
视觉进阶篇——模型训练常见问题
本文系统分析了机器学习中的三大关键问题:过拟合、欠拟合和梯度消失/爆炸。过拟合表现为模型在训练数据上表现优异但在测试数据上性能显著下降,可通过正则化、Dropout、早停和数据增强等方法解决。欠拟合则是模型无法充分学习训练数据模式,需通过增加模型复杂度、改进特征工程和调整超参数来优化。梯度消失/爆炸问题源于深层网络的链式法则计算,可采用ReLU激活函数、批归一化和残差连接等技术缓解。这些解决方案从理论和实践层面为提升模型性能提供了系统指导。原创 2025-11-15 20:59:26 · 1188 阅读 · 0 评论 -
视觉进阶篇——机器学习训练过程(手写数字识别,量大管饱需要耐心)
很多同学对机器学习和深度学习训练的整体概念不清晰,实际上任意一个模型的训练都会经历共同的步骤。这篇文章以手写数字识别带你理解模型训练。手写数字识别是机器学习的“Hello World”,也是理解神经网络训练流程的最佳切入点。本文将从数据准备→模型构建→训练循环→评估预测,完整复现用三层全连接神经网络解决MNIST手写数字分类问题的过程。每一步都会解释“为什么这么做”,并附可运行的代码示例。MNIST是LeCun等人整理的手写数字数据集,包含:目标:训练一个模型,输入手写数字图片,输出对应的数字(多分类问题)原创 2025-11-15 02:18:51 · 1697 阅读 · 1 评论 -
视觉进阶篇——图像数据增强从原理到实战(python/c++实现)
这里开启我们的进阶教程——数据增强。这里我们单指二维图像增强,又可以称作图像处理操作。这一讲我会直接从平面图像底层讲到代码实现并给出python和c++的具体实现可以给自己更多自由发挥的空间。这一讲不要指望看一篇就能学会,我还是作抛砖引玉,更加具体的东西需要大家自己下去慢慢体会。对于原始数据规模较小的情况,我们应该优先用强增强(Cutout、Mixup、RandAugment),增加样本的多样性;如果数据本身规模就很大,那我们用基础增强即可,避免过度扰动对模型造成不必要干扰。原创 2025-10-21 15:27:00 · 1572 阅读 · 0 评论 -
视觉进阶篇—— PyTorch 安装
本文详细介绍了在Ubuntu系统上安装PyTorch的两种方式(Conda和Pip)。对于初学者推荐使用Conda安装,它能自动管理CUDA环境并实现版本隔离。文章分别讲解了CPU版和GPU版的安装方法,重点说明了Conda安装时常见问题的解决方案,如缺少MKL库等。同时对比了Pip安装的优缺点,指出其需要手动配置CUDA环境的局限性。最后强调了验证安装成功的关键步骤,确保GPU可被正确调用。全文提供了从环境检查到安装验证的完整流程,帮助读者避开常见安装陷阱。原创 2025-11-13 20:50:36 · 906 阅读 · 0 评论
分享