python--一元线性回归模型分析

本文使用波士顿房价数据集进行一元线性回归分析,包括绘制变量与房价散点图、计算相关系数、建立线性回归模型并筛选显著性变量,最后选取相关系数大于等于0.5的变量建立新的线性模型,并展示预测结果。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、要求

boston 房价数据是机器学习中著名的基础数据集,包含 506 条记录,每条记录包含房
屋的 13 条属性,房价信息属性 MEDV 在 boston.target 中,具体(翻译成中文) 可通过如下语句查看:
print(boston.DESCR)
各属性的中文解释如下:

  • CRIM 城镇人均犯罪率
  • ZN 占地面积超过 25,000 平方尺的住宅用地比例
  • INDUS 城镇中非商业用地比例
  • CHAS Charles River 虚拟变量(如果边界是河流则为 1;否则为 0)
  • NOX 一氧化氮浓度
  • RM 每栋住宅平均房间数
  • AGE 1940 年前建成的自住房屋比例
  • DIS 距五个波士顿就业中心的加权距离
  • RAD 距离高速公路的便利指数- TAX 每 10,000 美元的全额房产税率
  • PTRATIO 城镇中学生教师比例
  • B 城镇中黑人比例
  • LSTAT 人口中低收入阶层比例
  • MEDV 自住房房价中位数

完成如下数据处理和分析任务:
(1)在一张画布上,画出每个变量与房价变化的散点图,并详细分析各个变量和房价
之间的关系。
(2)计算变量和房价的相关系数(相关系数的函数 df.corr())。
(3)建立所有变量和房价的线性回归模型,写出模型表达式,并分析模型的显著性。
(4)将系数检验结果不显著的变量去掉,重新建立线性模型。
(5)选择与房价的相关系数大于等于 0.5 的变量,作为模型的自变量,房价作为因变
量,建立线性回归模型,并将房价预测值和真实值绘制成折线图。

二、代码
from sklearn import datasets
import pandas as pd
import matplotlib.pyplot as plt
#from scipy.misc import factorial  依赖scipy  而且为1.2.0版本
#此文件依赖pillow


boston = pd.read_csv('./dataset/boston_house.csv')
df=pd.DataFrame(boston)

#print(df.iloc[:,-1])

#相关系数大于0.5
x_has=[]
y_predict=[]
plt.figure(1)
#第一题
plt.rcParams['font.sans-serif']='SimHei'
plt.rcParams['axes.unicode_minus']= False
for i in range(13
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值