一、实验背景
波士顿房价预测是一个经典的机器学习任务,类似于程序员世界的“Hello World”。和大家对房价的普遍认知相同,波士顿地区的房价是由诸多因素影响的。该数据集统计了13种可能影响房价的因素和该类型房屋的均价,期望构建一个基于13个因素进行房价预测的模型,如 图1 所示。

对于预测问题,可以根据预测输出的类型是连续的实数值,还是离散的标签,区分为回归任务和分类任务。因为房价是一个连续值,所以房价预测显然是一个回归任务。下面我们尝试用最简单的线性回归模型解决这个问题,并用神经网络来实现这个模型。
二、实验内容
2.1 假设空间
影响波士顿房价的因素:
feature_names = [ ‘CRIM’, ‘ZN’, ‘INDUS’, ‘CHAS’, ‘NOX’, ‘RM’,‘AGE’,‘DIS’, ‘RAD’, ‘TAX’, ‘PTRATIO’, ‘B’, ‘LSTAT’, ‘MEDV’ ]
假设多个影响房价的因素和房价之间是线性关系,可用线性方程表示
yi=x1w1+x2w2+⋯+xnwn+b y_{i}= x_{1}w_ {1}+ x_ {2}w_ {2}+\cdots+x_ {n}w_ {n}+byi=x1w1+x2w2+⋯+xnwn+b
y=∑i=1nxiwi+by= \sum _ {i=1}^ {n}x_ {i} w_ {i} +by=i=1∑nxiwi+b
2.2 线性回归原理
假设房价和各影响因素之间能够用线性关系来描述:
y=M2xjwj+b y= \frac {M}{2}x_ {j} w_ {j} +b y=2Mxjwj+b
模型的求解即是通过数据拟合出每个wjw_jwj和bbb。其中,wjw_j

本文详细介绍了如何使用波士顿房价数据集进行线性回归分析,并构建神经网络模型进行房价预测。探讨了数据预处理、模型设计、参数优化以及超参数调整策略,包括归一化方法、数据打乱、学习率和batch_size的选择对模型性能的影响。
最低0.47元/天 解锁文章
1万+





