机器学习中的线性回归与逻辑回归实战
1. 线性回归模型的数据集
为了让学习更有趣,我们使用真实的波士顿数据集。该数据集由美国人口普查局收集,包含了波士顿周边住房的相关信息,每条记录描述了波士顿的一个郊区或城镇,数据来源于1970年的波士顿标准大都市统计区(SMSA)。其属性定义如下:
| 属性 | 描述 |
| — | — |
| CRIM | 城镇人均犯罪率 |
| ZN | 占地面积超过25,000平方英尺的住宅用地比例 |
| INDUS | 每个城镇非零售商业用地的比例 |
| CHAS | 查尔斯河虚拟变量(如果地块与河流接壤则为1,否则为0) |
| NOX | 一氧化氮浓度(每千万分之一) |
| RM | 每个住宅的平均房间数 |
| AGE | 1940年之前建造的自住单位比例 |
| DIS | 到波士顿五个就业中心的加权距离 |
| RAD | 径向高速公路的可达性指数 |
| TAX | 每10,000美元的全值财产税率 |
| PTRATIO | 城镇的学生 - 教师比例 |
| B - 1000(Bk - 0.63)^2 - Bk | 城镇黑人的比例 |
| LSTAT | 低收入人群的百分比 |
| MEDV | 自住房屋的中位数价格(以千美元为单位) |
我们的目标变量是MEDV,即每个郊区房屋的中位数价格(以千美元为单位)。为了展示如何构建线性回归模型,我们暂时无需深入理解这些特征。在机器学习项目中,通常需要先研究输入数据,检查其分布、质量和缺失值等,但这里我们将跳过这些步骤,专注于使用TensorFlow实
超级会员免费看
订阅专栏 解锁全文
5万+

被折叠的 条评论
为什么被折叠?



