任务1 赛题分析
1 赛题描述
具体模拟赛题见链接:https://github.com/datawhalechina/team-learning/blob/master/数据竞赛(房租预测)
注:赛题与本次训练均来自于DataWhale组织
2 赛题分析
2.1 认识数据
根据赛题要求,我们依据数据集建立模型,预测房屋租金。这是典型的回归预测。
- 预测指标(回归评价标准采用R-Square)
残差平方和:
S S r e s = ∑ ( y i − y ^ i ) 2 SS_{res}=\sum\left(y_{i}-\hat{y}_{i}\right)^{2} SSres=∑(yi−y^i)2
总平均值:
S S t o t = ∑ ( y i − y ‾ i ) 2 SS_{tot}=\sum\left(y_{i}-\overline{y}_{i}\right)^{2} SStot=∑(yi−yi)2
其中 y ‾ \overline{y} y表示 y y y的平均值,得到 R 2 R^2 R2表达式为:
R 2 = 1 − S S r e s S S t o t = 1 − ∑ ( y i − y ^ i ) 2 ∑ ( y i − y ‾ ) 2 R^{2}=1-\frac{SS_{res}}{SS_{tot}}=1-\frac{\sum\left(y_{i}-\hat{y}_{i}\right)^{2}}{\sum\left(y_{i}-\overline{y}\right)^{2}} R2=1−