Code on Github
Kaggle Competition 进阶 – House Prices Prediction 房价预测 Part 1
Kaggle Competition 进阶 – House Prices Prediction 房价预测 Part 2
最近校招笔试稍稍告于段落,也终于有机会继续我的 Machine Learning 学习。
我所选择的第二个项目是 Kaggle 平台上的房价预测项目,链接参照 房价预测overview。
首先我的submission的结果是这样,
score的话是0.13650。其实这个结果比我在cross validation里面是要好的,比较意外,但是相比 LeaderBoard 前面控制在0.10之内的成绩来说还是挺不理想。所以下一步的计划是在我现在的结果的基础上,通过借鉴一些网上可以查到的别人的优秀思路和方法想办法把我的score提升到0.10左右。
不过这篇文章的内容就还是先简单介绍我的分析过程和模型方法。
具体的改进和提升就留到 Part 2 里面去。
项目概览 Overview
这次项目所要做的是根据数据给出的 Ames, Iowa, US 这个地方在过去四年间销售的房屋的房屋特征和房屋售价拟合出两者间的相关关系。并根据给出的房屋特征预测对于房屋的销售价格。预测结果好坏的衡量标准是 Root-Mean-Squared-Error (RMSE) ,
R M S E = ∑ i = 0 T ( y p r e d − y r e a l ) 2 T RMSE = \sqrt{\frac{\sum_{i=0}^T(y_{pred}-y_{real})^2}{T}} RMSE=T∑i=0T(ypred−yreal)2