机器学习-随机森林算法预测房租模型
解决问题
根据待租房源相关信息,通过随机森林机器学习算法构件预测模型,预测房租。属于机器学习监督学习中的回归问题。
数据集
数据集来源
https://www.datacastle.cn/taskIndex.html?id=2
探索性数据分析
# 1.1 简单查看 前几行和统计信息
print(df.head())
print(df.describe())
结果如下:
ID 位置 出租方式 区 卧室数量 卫的数量 厅的数量 地铁站点 地铁线路 小区名 小区房屋出租数量 居住状态 \
0 0 118.0 NaN 11.0 1 1 1 4.0 2.0 3072 128.90625 NaN
1 1 100.0 NaN 10.0 1 0 0 5.8 4.0 3152 132.81250 NaN
2 2 130.0 NaN 12.0 2 2 1 3.7 5.0 5575 42.96875 NaN
3 3 90.0 NaN 7.0 3 2 2 6.3 2.0 3103 85.93750 NaN
4 4 31.0 NaN 3.0 2 1 1 NaN NaN 5182 214.84375 NaN
总楼层 房屋朝向 房屋面积 时间 楼层 装修情况 距离 Label
0 23.636364 东南 86.279378 1 2 NaN 76.416667 5.602716
1 38.181818 东 170.456802 1 1 NaN 70.916667 16.977929
2 29.090909 东南 105.925190 1 0 NaN 57.250000 8.998302
3 58.181818 南 191.989407 1 2 NaN 65.833333 5.602716
4 54.545455 东北 104.270109 1 0 NaN NaN 7.300509
ID 位置 出租方式 区 \
count 196539.000000 196508.000000 24230.000000 196508.000000
mean 98269.000000 67.945982 0.900289 7.905139
std 56736.066616 43.522394 0.299621 4.025696
min 0.000000 0.000000 0.000000 0.000000
25% 49134.500000 33.000000 1.000000 4.000000
50% 98269.000000 61.000000 1.000000 9.000000
75% 147403.500000 103.000000 1.000000 11.000000
max 196538.000000 152.000000 1.000000 14.000000