
数据挖掘
seven_-
这个作者很懒,什么都没留下…
展开
-
kaggle初探(1)-- step by step实现泰坦尼克号船员获救预测
1.简介Kaggle是数据科学领域的一个重要竞赛网站,主要分为Featured、Research、Recruitment、Getting Started四个方面的竞赛,各个方面竞赛都有着自己的特点,对应着不同的人群。对于一个数据挖掘初学者而言,在kaggle开始一个竞赛之前要有一点必要的准备。2.前期准备1.账号注册: 注册一个kaggle账号是必须的,进入kaggle官网进行注...原创 2018-04-05 20:16:22 · 462 阅读 · 0 评论 -
kaggle初探(2)-- step by step实现泰坦尼克号船员获救预测
回顾前一章中对于kaggle网站的基本信息进行了介绍,进行了简单的数据可视化练习,这一章学习一下对数据特征的提取和分析,用例为kaggle Titanic特征工程notes:本文使用数据集下载地址 1.获救与否与家庭成员数目的关系 (feature 1)SibSp and Parch Parch类型–用来存储某人的父母和孩子数目 Sibsp类型–用来存储某人兄弟和配偶的数目...原创 2018-04-12 17:48:53 · 325 阅读 · 0 评论 -
kaggle初探(3)-- step by step实现泰坦尼克号船员获救预测
回顾前一章中对于如何对于泰坦尼克号中的数据进行特征工程,对于各个特征进行分析取舍,得到一个较有代表性的特征集,这一章可以开始对数据进行预测处理。模型融合notes:本文使用数据集下载地址 查看各个特征的相关性 colormap = plt.cm.RdBu plt.title('Pearson Correlation of Features', y=1.05, s...原创 2018-04-19 11:43:19 · 467 阅读 · 0 评论 -
Xgboots学习笔记
Xgboost学习笔记前言在按照kaggle官网的教程走Titanic预测流程时,完全按照教程走下来发现正确率并不是很高,打算对结果进行优化,从Xgboost和Sklearn入手来进行学习。学习笔记关于如何安装使用Xgboost在这里不再叙述,语言以python为例开始学习 Xgboost是什么?Xgboost是一个极端梯度增长(Extreme Gradient Bo...原创 2018-04-20 12:25:38 · 1133 阅读 · 0 评论