
菜鸟的Kaggle之路
摸不着脑子
在读菜鸡大学生,一步一步变成咸鱼的道路
展开
-
菜鸟的Kaggle之路(1) Titanic问题的初步分析
今天开始,又一个菜鸟开始走上了自己的Kaggle之路,以练代学,边学边练,不会再查。基础:coursera 机器学习正在看:deeplearning.ai课程 和 西瓜书今天我主要先熟悉了一下pandas和matplotlib的使用,用于观察数据首先引入(在notebook环境下使用matplotlib需要加一行%matplotlib inline才能正常显示)注:同时matplotlib不支...原创 2018-02-06 23:00:59 · 716 阅读 · 0 评论 -
菜鸟的Kaggle之路(2) Titanic问题的简单模型
今天,我希望第一次用python建一个回归二分类的模型。在网上寻找资料以后,我决定先使用sklearn库先进行数据处理,由上节的处理可知Age项需要填充,而同时Sex项的male与female需要转换成可以计算的数字#数据处理:Sex转换为可操作的0和1print(data_train["Sex"].unique())data_train.loc[data_train["Sex"] == "m...原创 2018-02-07 10:31:10 · 488 阅读 · 0 评论 -
菜鸟的Kaggle之路(3) Titanic问题的首次解决
嗯,这次就直接码代码了,首先说明一下,虽然网络上各种教程都说提取姓名能对结果产生很大影响,但还是太玄学了(做起来也好麻烦),所以最后并没有利用姓名。同时船票信息也被省去。优化了一个Family,也就是将Parch和SibSp合并。最终使用了六个特征达到了0.77990,进了50%,对于现阶段学习情况以及参数省了那么多还能到达接近78%,个人还是很满意的,日后可以继续优化模型。这个项目感觉上80就很...原创 2018-02-07 19:06:14 · 587 阅读 · 1 评论