数据:sklearn中的datasets的California——housing
方法:使用多元线性回归进行房价预测
知识点:matplotlib绘图,相关系数,数据标准化处理
##载入所需要的模块
from __future__ import print_function
import numpy as np
import pandas as pd
##matplotlib
import matplotlib
import matplotlib.pyplot as plt
##加载数据
from sklearn import datasets
housing_data=datasets.fetch_california_housing()
housing=pd.DataFrame(housing_data.data,columns=housing_data.feature_names)
target=pd.Series(housing_data.target)
housing.head()
target.head()
housing.info()
housing.describe()
运行结果:
如上图所示的是加利福尼亚房价数据中的8个特征值的describe信息
#用直方图描绘几个特征的分布信息
housing.hist(figsize=(20,15),bins=50,grid=False)#对每一个特征进行柱状图绘画,bins的意思是用50个分割,grid代表是否用网格划分
plt.show()