Spark MLlib案例:采用线性回归模型预测房价

本文通过Spark MLlib使用线性回归模型预测北京海淀区的房价。首先,介绍了问题背景和数学模型的构建,接着详细阐述了数据准备、模型训练、权重查看及预测过程。在补充练习中,提供了绘制房价散点图的方法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、提出任务

  • 建立数学模型的过程,是把错综复杂的实际问题简化、抽象为合理的数学结构的过程。要通过调查、收集数据资料,观察和研究实际对象的固有特征和内在规律,抓住问题的主要矛盾,建立起反映实际问题的数量关系,然后利用数学的理论和方法去分析和解决问题。

  • 北京市海淀区部分楼盘价格数据
    在这里插入图片描述
    在这里插入图片描述

  • 给定已知数据,由这些数据估计出海淀区某个房子售价大概在多少万?从上图可以看到,用一些离散的点把刚才这些数据表示出来。上图横坐标是面积,纵坐标是售价。从中可以看到一定的规律。如200平的面积售价在上千万了。机器学习就是用来做这样的事情,即从已知数据找出规律,方便做出预测或者估计的功能。

  • 那如何去找出规律呢?
    在这里插入图片描述

  • 可以看到,它的点基本都围绕着这个横线。那200平米,基本上在1400万到1600万之间。机器学

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

酒城译痴无心剑

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值