房价预测--数据挖掘(随机森林)

本文由一名编程转算法的萌新分享,通过随机森林进行房价预测。介绍了从理解机器学习流程、定义模型(选择随机森林)、训练模型、预测与评估的全过程。文中提到,随机森林不仅能做预测,还适用于分类和回归问题,通过实践加深了对模型本质的理解。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

背景和一些小知识

其实,我是萌新一枚,hhh~~
下面简单分享一下我的学习过程,希望能帮助更多的萌新。
首先,我对机器学习有了一些简单的知识概念,但是,对于我这么一个从程序员过渡算法的小白来说,仅仅给我灌输理论知识是不够用的,我需要自己走一遍流程,我才能进一步掌握机器学习或者说数据挖掘到底是一个怎样的过程。

上面说的流程是指:
(1) 定义模型
(2) 训练模型
(3) 用模型做预测/分类等等
(4) 评估模型
这个流程基本上贯彻我们做算法的每个项目,每个算法项目比作的一个流程,一步都不能少。简单说一下,这个流程的每个步骤的含义:

1.定义模型:首先,你有一个数据集,那么你用这个数据集来训练出一个模型,那你要选择一种方法来训练模型吧?你要选什么样的方法来训练模型呢?机器学习里训练模型的方法非常之多,SVM(支持向量机)、神经网络、贝叶斯等等。这里我要做房价的预测,我选用的是随机森林,随机森林不单只可以做预测,还可以做分类,甚至还能做回归问题。虽然我使用的随机森林比较简单,但是也算是一种入门了吧。

2.训练模型:确定了要选择的训练方法之后,就可以使用这种方法,把训练集丢进去,让他自己训练。那这些训练方法哪里来的呢?这里我们使用python里面的库,比如sklearn库里面的随机森林、评估方法等等。

3.用模型做预测:第二步的时候,我们已经丢训练集进去训练好模型了,那么我们现在把测试集也丢进去,就能出来我们想要的测试集啦~~~

4.评估模型:我们怎么知道我们训练出来的模型到底好还是不好呢?我们会选择一些计算误差的函数,这里我们使用均方对数误差(实际上就是RMSE,只不过变量使用对数的形式而已)。然后查看你误差函数得出的结果如何,如果偏差太大,那就要想办法减少误差。
在这里插入图片描述

好啦~这里就大概普及这么多知识,既然使用到随机森林,那么

评论 12
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值