数据分析案例:多元线性回归预测房价(python实现)

本文通过Python的sklearn库分析California housing数据集,使用多元线性回归模型预测房价。探讨了特征相关性,发现MedInc(平均收入)与房价正相关。经过数据标准化处理,得到预测损失为0.5243209861846072,并通过图表展示预测结果。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

数据:sklearn中的datasets的California——housing

方法:使用多元线性回归进行房价预测

知识点:matplotlib绘图,相关系数,数据标准化处理

##载入所需要的模块
from __future__ import print_function
import numpy as np
import pandas as pd


##matplotlib
import matplotlib
import matplotlib.pyplot as plt

##加载数据
from sklearn import datasets
housing_data=datasets.fetch_california_housing()
housing=pd.DataFrame(housing_data.data,columns=housing_data.feature_names)
target=pd.Series(housing_data.target)
housing.head()
target.head()
housing.info()
housing.describe()

运行结果:

如上图所示的是加利福尼亚房价数据中的8个特征值的describe信息

#用直方图描绘几个特征的分布信息
housing.hist(figsize=(20,15),bins=50,grid=False)#对每一个特征进行柱状图绘画,bins的意思是用50个分割,grid代表是否用网格划分
plt.show()

 

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值