
天池cv入门竞赛
yue__yang
这个作者很懒,什么都没留下…
展开
-
阿里云天池cv入门赛记录(5)——TASK5 模型集成
这次赛题学习的最后一个任务,是学校如何使用集成学习提高预测精度。知识点包括:集成学习方法,深度学习中的集成学习和结果后处理思路。(虽然我跑一次要一天,还不一定成功,但要坚持学习)1、集成学习方法常见的集成学习方法有堆叠,装袋和提升,同时这些集成学习方法与具体验证集划分联系紧密。下面假设建造了10折交叉验证,训练得到10个CNN模型。那么在10个CNN模型可以使用如下方式进行集成:对预测的结果的概率值进行平均,然后解码为特定字符对预测的字符进行投票,得到最终字符。2、深度学习中的集成学习原创 2020-06-02 22:21:25 · 294 阅读 · 0 评论 -
阿里云天池cv入门赛记录(4)——TASK4 模型训练与验证
在学习这章内容之前,作为小白一直对“训练集”“验证集”的概念和作用非常模糊,“过拟合”具体是什么意思也没有深入的了解。本次任务就是对这些在训练和验证模型的过程中遇到的问题进行的讲解。1、学习目标理解验证集的作用,并使用训练集和验证集完成训练学会使用Pytorch环境下的模型读取和加载,并了解调参流程2、如何构造验证集?在具体回答“如何构造验证集”这个问题之前,作为小白,需要搞清楚几个概念。(训练集、验证集、测试集、过拟合、欠拟合……)首先,先来明确几个“集”的作用:训练集(Train S原创 2020-05-30 23:14:59 · 477 阅读 · 0 评论 -
阿里云天池cv入门赛记录(3)——TASK3 字符识别模型
前面进行了赛题的理解和赛题数据的读取,这次的任务是学习从头搭建一个字符识别模型。1、CNN介绍卷积神经网络(简称CNN)是一类特殊的人工神经网络,是深度学习中重要的一个分支。CNN在很多领域都表现优异,精度和速度比传统计算学习算法高很多。特别是在计算机视觉领域,CNN是解决图像分类、图像检索、物体检测和语义分割的主流模型。CNN每一层由众多的卷积核组成,每个卷积核对输入的像素进行卷积操作,得到下一次的输入。随着网络层的增加卷积核会逐渐扩大感受野,并缩减图像的尺寸。CNN是一种层次模型,输入的是原始原创 2020-05-26 19:08:23 · 333 阅读 · 0 评论 -
阿里云天池cv入门赛记录(2)——TASK2 数据读取与数据扩增
经过前几天的pytorch安装、anaconda重装等一系列问题,cv小白终于把baseline跑通了!!但是,对于代码仍然有很多地方不理解,好在从TASK2开始,就是对问题的详细讲解了。任务二的主要内容是数据读取、数据扩增方法和Pytorch读取赛题数据三个部分。一、常用的图像读取方法对于图像数据的处理,首先需要完成对图像数据的读取操作,在Pytorch中有很多库可以完成,比较常见的有Pillow和OpenCV。(之前只用过openCV做图像变换,没有了解过Pillow)1、Pillow首先放上原创 2020-05-22 21:23:30 · 566 阅读 · 0 评论 -
Windows10 + anaconda+pytorch(含anaconda卸载重装)
为了参加天池入门级的cv竞赛,重新安装了pytorch 和anaconda之前做过简单的cv项目,但是pytorch版本较低,不适用这次的竞赛(小白不懂)于是决定升级pytorch的版本,但是引发了一系列的问题,一整天都在装包了。。。。。问题一:新创建虚拟环境失败应该是网络超时的原因,忘记截图了,可能是当时家里网络极差,但是我以为是镜像的原因(当时使用的是清华源)。所以恢复了默认源。问题二:conda更新失败恢复默认源后,创建虚拟环境提示要升级conda,但是update以后很快就结束了,更新失原创 2020-05-19 21:47:23 · 3659 阅读 · 1 评论 -
阿里云天池cv入门赛记录(1)——TASK1 赛题理解、beseline跑通
赛题名称:零基础入门CV之街道字符识别赛题任务:以计算机视觉中字符识别为背景,要求选手预测街道字符编码,是一个典型的字符识别问题。为了简化难度,赛题数据采用公开数据集SVHN。一、赛题数据赛题以街道字符为赛题数据,来自收集的SVHN街道字符,并进行了匿名采样处理。训练集数据包括3W张照片,验证集数据包括1W张照片,每张照片包括颜色图像和对应的编码类别和具体位置:为了比赛公平性,测试集A包括4W张照片,测试集B包括4W张照片。为了降低难度,提供了训练集、验证集和测试集中所有字符的位置框。二、数据原创 2020-05-19 21:19:57 · 1886 阅读 · 1 评论 -
阿里云天池cv入门赛记录(0)—— 开块地立个flag
cv小白和师妹一起组队学习,参加天池“零基础入门CV赛事- 街景字符编码识别”竞赛。赛题以计算机视觉中字符识别为背景,要求选手预测真实场景下的字符识别,是一个典型的字符识别问题。一、赛题数据赛题来源自Google街景图像中的门牌号数据集(The Street View House Numbers Dataset, SVHN),并根据一定方式采样得到比赛数据集。数据集报名后可见并可下载,该数据来自真实场景的门牌号。训练集数据包括3W张照片,验证集数据包括1W张照片,每张照片包括颜色图像和对应的编码类别和转载 2020-05-18 17:45:27 · 327 阅读 · 0 评论