- 博客(17)
- 收藏
- 关注
原创 DataWhale-天池街景数字识别竞赛-task5-模型集成
背景2020年5月的DW组队学习选择了天池的街景字符编码识别,在这个入门竞赛中,数据集来自Google街景图像中的门牌号数据集(The Street View House Numbers Dataset, SVHN),并根据一定方式采样得到比赛数据集。评测标准为测试集预测结果的准确率,即编码识别正确的数量占测试集图片数量的比率。组队学习的第五个任务是学会使用集成学习的方法来提高预测的精度。本章学习手册内容由 安晟 编写,而本篇博客则是这章内容的笔记,在这里对作者表示感谢,受益匪浅!常用集成学
2020-06-02 17:55:05
332
原创 DataWhale-天池街景数字识别竞赛-task4-模型训练与验证
背景2020年5月的DW组队学习选择了天池的街景字符编码识别,在这个入门竞赛中,数据集来自Google街景图像中的门牌号数据集(The Street View House Numbers Dataset, SVHN),并根据一定方式采样得到比赛数据集。评测标准为测试集预测结果的准确率,即编码识别正确的数量占测试集图片数量的比率。组队学习的第四个任务是学会用PyTorch搭建的CNN模型进行训练与验证,同时了解如何保存模型参数或者加载参数。最后学习在不同训练集与验证集精度下应该如何调参。本章学习手
2020-05-29 22:19:03
470
原创 DataWhale-天池街景数字识别竞赛-task3-模型初步训练
背景2020年5月的DW组队学习选择了天池的街景字符编码识别,在这个入门竞赛中,数据集来自Google街景图像中的门牌号数据集(The Street View House Numbers Dataset, SVHN),并根据一定方式采样得到比赛数据集。评测标准为测试集预测结果的准确率,即编码识别正确的数量占测试集图片数量的比率。组队学习的第三个任务是用PyTorch搭建一个简单的CNN模型进行训练,熟悉操作后,后续可以替换为使用预训练的Resnet18进行训练。本章学习手册内容由 张强 编写,而
2020-05-26 13:00:10
527
原创 DataWhale-天池街景数字识别竞赛-task2-数据载入
背景2020年5月的DW组队学习选择了天池的街景字符编码识别,在这个入门竞赛中,数据集来自Google街景图像中的门牌号数据集(The Street View House Numbers Dataset, SVHN),并根据一定方式采样得到比赛数据集。评测标准为测试集预测结果的准确率,即编码识别正确的数量占测试集图片数量的比率。组队学习的第二个任务是学习PyTorch的自定义数据集制作方法,并利用torchvision.transforms中的数据扩增函数对样本进行变换,以增强模型的泛化能力。本
2020-05-23 22:37:39
437
原创 DataWhale-天池街景数字识别竞赛-task1-赛题理解
背景2020年5月的DW组队学习选择了天池的街景字符编码识别,在这个入门竞赛中,数据集来自Google街景图像中的门牌号数据集(The Street View House Numbers Dataset, SVHN),并根据一定方式采样得到比赛数据集。而数据集共分为训练集(3W)、验证集(1W)和测试集(4W)。为了降低难度,比赛提供了数据集中字符的位置框(左上角坐标X,字符高度,左上角坐标Y,字符宽度),并结合字符的编码(label)一起放入到一个json文件中。评测标准为测试集预测结果的
2020-05-19 22:50:02
631
原创 一个有趣的博弈或推理游戏——除数博弈(动态规划与归纳法)
除数博弈是一个有趣的游戏,更重要的是,看完这篇文章你能随意操纵这个游戏,让游戏的结果对你有利(假设对方没玩过)。
2020-04-10 00:16:53
933
1
原创 DATAWHALE-数据挖掘竞赛入门-task5-模型融合
背景在这次Datawhale的组队学习中,我们主要学习数据竞赛的相关知识,其中task5是有关于模型融合的知识。模型融合简介对完成调参的多个模型所得的预测结果进行综合,以不同的方法进行结果的融合(如加权平均、stacking、voting等),以提升模型整体的性能。融合方法在Datawhale的学习手册中,ML67介绍了以下三大类的方法:1.简单加权融合:回归(分类概率...
2020-04-04 21:30:28
251
原创 DATAWHALE-数据挖掘竞赛入门-task4-建模调参
背景在这次Datawhale的组队学习中,我们主要学习数据竞赛的相关知识,其中task4是有关于建模调参的知识。建立模型1.主要模型线性回归模型 ——>线性回归模型知乎专栏 线性回归是一种被广泛应用的回归技术,也是机器学习里面最简单的一个模型,它有很多种推广形式,本质上它是一系列特征的线性组合,在二维空间中,你可以把它视作一条直线,在三维空间中可以视作是一个...
2020-04-01 21:31:53
268
原创 Jupyter Notebook闪退 显示DLL Load Failed 你可以尝试以下方法
背景前几天打开Jupyter准备开敲,不料发生了如下错误。DLL Load Failed!!如果你也有以上的报错,你可以尝试:
2020-03-28 23:02:10
1128
原创 DATAWHALE-数据挖掘竞赛入门-task3-特征工程
背景在这次Datawhale的组队学习中,我们主要学习数据竞赛的相关知识,其中task3是有关于特征工程的知识。特征工程数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。从上面这句流传已久的说法中,不难看出特征工程在机器学习中起到的巨大作用。下面就来简单介绍一下什么是特征工程。根据维基百科的介绍(链接在这),特征工程是利用某个领域的知识,通过数据挖掘技术从...
2020-03-28 20:04:21
404
原创 DATAWHALE-数据挖掘竞赛入门-task2-EDA-数据探索性分析
背景这次的数据挖掘竞赛入门学习选取了阿里天池的二手车价格预测作为赛题,从数据竞赛的流程入手,为竞赛新人提供指导。第二章主要是对数据探索性分析的介绍。
2020-03-24 21:55:38
614
原创 用VS code通过Git连接Github以及gitignore的小tips
本文介绍用VS Code的版本控制(source control)通过图形指令(或者说不使用git终端)连接到Github仓库的方法,最后给了一些不参与版本控制的文件/文件夹的设置教程(gitignore)以供参考。
2020-03-16 00:10:18
1257
原创 MySQL忘记密码无法登陆的解决方案
背景 之前下了MySQL后配置完就因为考试暂时丢到一边了,最近想继续学习,发现把登录密码忘了。结果报错:ERROR 1045 (28000): Access denied for user 'root'@'localhost' (using password: YES)。而网上关于改密码的方法也是多种多样,然而我却尝试了好几个才最终修改成功。谨以此分享一些经验给有相同经历的小伙伴。...
2019-05-12 13:54:53
411
原创 C语言 动态链表的注意点(出现0xcdcdcdcd的情形)
背景 最近学习了一下动态链表,第一次编的时候感觉不太对劲,输出结果后光标一直闪着卡在那里,没有显示那个press any button to continue.于是我仔细跟书本核对了一下,果然发现了错误。具体分析 先看看我第一次写的代码。(输入多个学号与姓名,组成链表,学号为0表示结束,然后全部输出)#include<stdio.h>#include...
2018-12-20 22:31:18
1785
3
原创 约瑟夫问题——其中一种算法的理解(神级代码)
约瑟夫问题 据说著名犹太历史学家 Josephus有过以下的故事: 在罗马人占领乔塔帕特后,39 个犹太人与Josephus及他的朋友躲到一个洞中,39个犹太人决定宁愿死也不要被敌人抓到,于是决定了一个自杀方式,41个人排成一个圆圈,由第1个人开始报数,每报数到第3人该人就必须自杀,然后再由下一个重新报数,直到所有人都自杀身亡为止。然而Josephus 和他的朋友并不...
2018-12-13 15:28:41
589
原创 HihoCoder#1051 补提交卡
描述 小Ho给自己定了一个宏伟的目标:连续100天每天坚持在hihoCoder上提交一个程序。 100天过去了,小Ho查看自己的提交记录发现有N天因为贪玩忘记提交了。于是小Ho软磨硬泡、强忍着小Hi鄙视的眼神从小Hi那里要来M张"补提交卡"。每张"补提交卡"都可以补回一天的提交,将原本没有提交程序的一天变成有提交程序的一天。 小Ho想知道通过利用这...
2018-11-24 13:58:53
325
原创 hihoCoder#1039 字符消除
描述1)如果s包含长度超过1的由相同字母组成的子串,那么这些子串会被同时消除,余下的子串拼成新的字符串。 eg."ABCCBCCCAA"中"CC","CCC"和"AA"会被同时消除,余下"AB"和"B"拼成新的字符串"ABB"。2)上述消除会反复一轮一轮进行,直到新的字符串不包含相邻的相同字符为止。例如”ABCCBCCC
2018-11-17 23:03:32
269
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人