
比赛
CoderPro
这个作者很懒,什么都没留下…
展开
-
模型集成
模型集成集成学习集成学习就是说将多个“单学习器”使用某种策略结合起来,使得整体的泛化能力得到提高。因为在机器学习中我们的目标是学习到一个稳定的并且在各个方面都表现较好的模型,但往往我们只能得到一个由某种偏好的模型即在某些方面表现得比较好,因此集成学习通过集合多个弱监督模型来得到一个更好的模型。集成学习方法一般可以分为以下几类:BaggingBoostingStacking在本次任务中我们也可以使用集成学习技术,比如我们训练得到了若干个CNN模型,那么我们可以通过计算平均值的方式将这些模型集原创 2020-06-02 08:41:29 · 221 阅读 · 0 评论 -
模型训练与验证详解
模型训练与验证在前面我们已经准备好了数据集并完成了模型的搭建,接下来我们就要进行模型的训练与验证。有些同学可能会觉得模型的训练代码编写并不难,我个人也认为如此,但我们并不是把模型训练一下就完事了,后续我们还需要计算模型的各项性能指标,并通过验证集选取最优模型,这里面也还是有些坑的,因此有必要好好说道说道。训练函数我们将一次训练过程封装到一个函数中,先看代码再解释:model = SVHN_Model1()criterion = nn.CrossEntropyLoss()optimizer = t原创 2020-05-29 20:50:47 · 5687 阅读 · 0 评论 -
模型构建
字符识别模型对于字符识别任务,我们已经在前面提出了三种思路,这里我们主要基于思路一来讲解如何利用pytorch搭建深度学习模型。思路回顾我们的思路是将字符识别转换为定长字符识别模型,经过数据分析可以得到字符为6个的图片仅有一张,因此我们确定定长字符个数为5个,对于不到五个字符的我们将余下的字符填充为10,我们的模型要从数据集中学习到如何从一张图片中识别出5个字符,对于这类视觉问题,我们主要使用卷积神经网络模型。预备知识利用pytorch我们可以很快速地搭建CNN模型,主要利用pytorch实现这些原创 2020-05-26 20:58:59 · 1320 阅读 · 1 评论 -
pytorch数据增强与数据读取
数据增强与数据读取数据增强为什么要进行数据增强深度学习模型的参数很多,模型复杂度很高,如果此时数据集数量不够导致数据集中数据的复杂度没有涵盖所有特征空间,那么模型就会学习到这些数据集的一些独有的特征,这会导致过拟合的问题,因此我们有必要对数据集进行增强操作以减小过拟合的风险。利用pytorch进行数据增强在pytorch的torchvision库中提供了很多的数据增强方法,主要可以分为四类:裁剪翻转和旋转图像变换对transform操作使得数据增强更加灵活具体的函数可以参考pytorc原创 2020-05-23 21:00:18 · 2355 阅读 · 0 评论 -
街景字符识别baseline
街景字符识别赛题理解与解决方案题目要求:给定一张街景字符图片,能够正确识别出其中的数字字符。根据题目的要求可以分为三种思路:定长字符识别:由于图片中的数字字符最多不会超过6个,因此可以将问题视为一个定长字符问题。我们需要将数据中的label填充为6位,不存在数字的位置填充为X,因此最终的问题就是6个字符的分类问题,一共分为11个类别,若识别为X,则表示该位置没有数字。不定长字符识别问题:利用字符识别模型直接进行不定长字符识别。目标检测问题:利用YOLO、SSD等目标检测算法先检原创 2020-05-20 14:46:27 · 626 阅读 · 0 评论