
街景字符编码识别项目学习笔记
幻灵H_Ling
这个作者很懒,什么都没留下…
展开
-
街景字符编码识别项目学习笔记(六)模型集成
内容简介由之前相关的博客介绍的内容,我们已经可以通过pytorch构建一个初步的字符识别模型,并实现了端到端的识别验证预测的相关工作。本节,我们聚焦模型集成有关内容,仍然是在保持模型本体不变的基础上,尽可能增加模型准确率的一些方法。集成学习方法在机器学习中的集成学习可以在一定程度上提高预测精度,常见的集成学习方法有Stacking、Bagging和Boosting,同时这些集成学习方法与具体验证集划分联系紧密。由于深度学习模型一般需要较长的训练周期,如果硬件设备不允许建议选取留出法,如果需要追求精度原创 2020-06-02 20:49:59 · 206 阅读 · 0 评论 -
街景字符编码识别项目学习笔记(五)模型训练与验证
内容简介学习笔记(四)中,初步介绍了以AlexNet为实例用pytorch实现卷积神经网络的方式,并对赛题所应用的baseline定长字符识别模型进行了建立。本节中,我们主要关注模型建立之后的训练以及验证过程。模型训练与验证神经网络的训练过程实际上就是网络对输入数据进行特征提取的过程。通过模型预测输出和给定输出之间误差的损失函数的梯度反作用于网络,以更新网络当中的参数值,从而提高模型对给定任务的解决能力。可以想象,在实际训练过程当中,模型会倾向于增强对输入数据的特征提取能力,因为同样的数据往往会输入原创 2020-05-30 21:15:52 · 339 阅读 · 0 评论 -
街景字符编码识别项目学习笔记(四)CNN介绍及字符识别模型的pytorch实现
内容简介本文主要介绍在项目应用中使用的卷积神经网络,及其在pytorch中的如何实现。CNN介绍及其发展历程CNN介绍卷积神经网络(Convolutional Neural Network)是一类特殊的神经网络。同全连接神经网络等不同的是,卷积神经网络直接对二维数据乃至三维等高维数据进行处理,并且具有更高的计算精度和速度。尤其是在计算机视觉领域,CNN的应用非常广泛,使其成为了解决图像分类、图像检索、目标检测、语义分割的主流模型。CNN当中应用的卷积操作和传统的图像处理及信号处理当中使用的卷积操作原创 2020-05-26 22:10:37 · 1414 阅读 · 0 评论 -
街景字符编码识别项目学习笔记(三)torchvision中的数据增强方法
内容简介本文介绍torchvision当中有关数据增强方法的使用以及其在街景字符编码识别项目起到的效果。基本方法总结如下表方法效果transforms.Resize((m,n))将原始图像进行resizetransforms.RandomCrop((m,n))将原始图像进行随机剪裁transforms.CenterCrop((m.n))取图像中心处进行一定大小的剪裁transforms.ColorJitter(a,b,c,d)调整原始图像有关颜色对比度等参原创 2020-05-23 21:29:54 · 589 阅读 · 0 评论 -
街景字符编码识别项目学习笔记(二)pytorch in deep learning
内容简介本文为针对Datacamp上的Introduction to deep learning by pytorch课程的学习总结。Datacamp(官网链接)内含许多python的专题知识讲解,以几分钟的视频教学加在线编程实操为主。笔者在下两个博客中将总结pytorch中的基本张量创建以及其在深度学习当中的一些应用,最终将实现Alexnet并完成从读取数据到训练评估的全过程。本博客先总结tensor的基本运算,而后实现基本的全连接神经网络,下个博客将介绍卷积神经网络相关操作,并实现AlexNet。t原创 2020-05-21 17:16:18 · 403 阅读 · 0 评论 -
街景字符编码识别项目学习笔记(一)赛题理解
datawhalecv项目系列学习博客(一)赛题理解原创 2020-05-19 23:22:24 · 520 阅读 · 0 评论