** 波士顿房价数据集(Boston House Price Dataset)包含对房价的预测,以千美元计,给定的条件是 房屋及其相邻房屋的详细信息。
** 该数据集是一个回归问题。每个类的观察值数量是均等的,共有 506 个观察,13 个输入变量和1个输 出变量。**
** sklearn库的datasets包含该数据集( load_boston)****
作业一,子图一 画出TAX和RAD的两列的散点图 子图二 画出TAX和RAD的两列线性回归算法拟合出的折线图
import matplotlib.pyplot as plt #导入一个绘图模块matplotlib.pyplot
from sklearn.datasets import load_boston #导入在sklearn.datasets库中的波士顿房价数据集
import pandas as pd
import numpy as np
data_boston=load_boston().data
temp=pd.DataFrame(data_boston,columns=load_boston().feature_names) #所有数据的数据框形式
y=load_boston().target #数据的标签
plt.subplot(121) #subplot 子图画法,表示为一行两列占用第一个,即第一行第一列
plt.scatter(temp.iloc[:,8],temp.iloc[:,9],s=2) #画散点图
from sklearn.linear_model import LinearRegression #线性回归算法
linear1=LinearRegression().fit(temp.iloc[:,8].values.reshape(-1,1),temp.iloc[:,9])
plt.subplot(122)
x=np.arange(0,20,0.01).reshape(-1,1)
plt.plot(x,linear1.predict(x))
plt.show()
作业二,画出所有列均值的柱状图,要求标注出对