上篇(文章6算法代码讲座6:最小二乘法理论原理、典型案例与MATLAB实现)讲了最小二乘法,以弹簧的实验数据为背景问题,进行了最小二乘法的实践,其中自变量数据仅有一个因素,求解比较简单,本文进一步,针对自变量有多个因素,同时符合线性假设的最小二乘问题,举例演示。
1.介绍一个数据集
波斯顿房价数据集(Boston Housing Dataset)是一个经典的机器学习回归数据集,包含506个样本和13个特征变量,用于预测波士顿地区房屋(中位数)价格(MEDV)。主要特征变量包括:
CRIM:城镇人均犯罪率。
RM:平均房间数(与房价强正相关)。
LSTAT:低收入人口比例(与房价强负相关)。
DIS:就业中心距离。
PTRATIO:师生比例
2.多元线性回归实例:房价预测
本文为了简洁易懂,使用上述数据集简化选择后的子数据集,作为原始数据,使用最小二乘法,拟合各变量与房价的关系。
简化选择后的房价数据集如下,共包含四列10组数据,其中前三个为因素变量(包括面积(m²), 房间数, 房龄(年),),最后一个为响应变量(房价(万元)):
| 序号 |
面积(m²), 房间数, 房龄(年), 房价(万元) |
| 1 |
80, 2, 5, 320; |
| 2 |
95, 3, 2, 420; |
| 3 |
110, 3, 10, 380; | <

最低0.47元/天 解锁文章
1794

被折叠的 条评论
为什么被折叠?



