
街景字符编码项目
威士忌燕麦拿铁
SLAM小白一枚
展开
-
街景字符编码识别项目学习笔记(五)
学习目标:学习集成学习方法以及交叉验证情况下的模型集成、学会使用深度学习模型的集成学习、以及对5月31号安神的直播做了一些总结 一、模型集成 1 机器学习中的集成学习方法 在机器学习中的集成学习可以在一定程度上提高预测精度,常见的集成学习方法有Stacking、Bagging和Boosting,同时这些集成学习方法与具体验证集划分联系紧密。 由于深度学习模型一般需要较长的训练周期,如果硬件设备不允许建议选取留出法,如果需要追求精度可以使用交叉验证的方法。 下面假设构建了10折交叉验证,训练得到10个CN.原创 2020-06-02 18:47:15 · 546 阅读 · 2 评论 -
街景字符编码识别项目学习笔记(四)
学习目标:理解验证集的作用,学会怎样构建验证集、学会使用训练集和验证集完成模型训练和验证,学会PyTorch下的模型保存与加载以及模型调参 1 构造验证集 在机器学习模型(特别是深度学习模型)的训练过程中,模型是非常容易过拟合的。深度学习模型在不断的训练过程中训练误差会逐渐降低,但测试误差的走势则不一定。 在模型的训练过程中,模型只能利用训练数据来进行训练,模型并不能接触到测试集上的样本。因此模型如果将训练集学的过好,模型就会记住训练样本的细节,导致模型在测试集的泛化效果较差,这种现象称为过拟合(Ove.原创 2020-05-31 00:05:19 · 597 阅读 · 0 评论 -
街景字符编码识别项目学习笔记(三)
学习目标:学习CNN基础和原理;使用Pytorch框架构建CNN模型,并完成训练 1 卷积神经网络CNN 1.1 CNN简介 卷积神经网络(简称CNN)是是一类特殊的人工神经网络,是深度学习中重要的一个分支。它专门用来处理具有类似网格结构的数据,比如说时间序列数据(可以认为是在时间轴上有规律地采样形成的一维网格)以及图像数据(二维像素网格)。 CNN在很多领域都表现优异,精度和速度比传统计算学习算法高很多。特别是在计算机视觉领域,CNN是解决图像分类、人脸识别、图像检索、物体检测和语义分割的主流模型。近.原创 2020-05-26 20:41:24 · 418 阅读 · 0 评论 -
街景字符编码识别项目学习笔记(二)
学习目标:学习Python和PyTorch中图像读取;学会数据扩增方法;使用PyTorch读取赛题数据 1 Python图像读取 由于赛题数据是图像数据,赛题的任务是识别图像中的字符。因此我们首先需要完成对数据的读取操作,在Python中有很多库可以完成数据读取的操作,比较常见的有Pillow和OpenCV。 1.1 Pillow函数库 Pillow是Python图像处理函式库(PIL)的一个分支。PIL是一个函式库,提供了几个操作图像的标准程序。它是一个功能强大的函式库,但自2011年以来就没有太多的.原创 2020-05-23 16:02:07 · 483 阅读 · 0 评论 -
街景字符编码识别项目学习笔记(一)
学习目标:理解赛题背景和赛题数据,完成赛题报名和数据下载,理解赛题的解题思路 首先贴出Datawhale开源项目链接和天池赛事报名链接: Datawhale开源项目:[https://github.com/datawhalechina/team-learning/tree/master/03%20%E8%AE%A1%E7%AE%97%E6%9C%BA%E8%A7%86%E8%A7%89/%E8%AE%A1%E7%AE%97%E6%9C%BA%E8%A7%86%E8%A7%89%E5%AE%9E%E8%B.原创 2020-05-20 11:58:18 · 1603 阅读 · 0 评论