Kaggle竞赛 —— 房价预测 (House Prices)

本文介绍了作者在Kaggle房价预测比赛中,通过特征工程(包括离散型变量排序赋值、特征组合和PCA)、数据清洗以及集成方法(加权平均和Stacking)提升模型性能的过程。作者强调了理解特征含义和选择合适评估指标的重要性,并分享了在特征工程和模型融合中的具体操作和经验。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >


完整代码见kaggle kernelGithub

比赛页面:https://www.kaggle.com/c/house-prices-advanced-regression-techniques

这里写图片描述

这个比赛总的情况就是给你79个特征然后根据这些预测房价 (SalePrice),这其中既有离散型也有连续性特征,而且存在大量的缺失值。不过好在比赛方提供了data_description.txt这个文件,里面对各个特征的含义进行了描述,理解了其中内容后对于大部分缺失值就都能顺利插补了。

参加比赛首先要做的事是了解其评价指标,如果一开始就搞错了到最后可能就白费功夫了-。- House Prices的评估指标是均方根误差 (RMSE),这是常见的用于回归问题的指标 :

Ni=1(yiyi^)2N
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值