问题分析
Boston housing已有数据列表为506*14的数据表格,具体数据对照表如图所示
本次学习目的,就是基于已有数据分析对于特定文化下特定城市的房屋价格影响,并通过linear model的方法,完成模型训练,预测房屋价格,并表示出这个模型的好坏。
为了更好的进行训练与检测,这里把506条数据分为两组,一组404条为training组,一组102条为test组。
初步分析所有数据,调用matlab对各个参数与房屋价格进行画图分析
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import sklearn
from sklearn.datasets import load_boston
boston = load_boston()
bos = pd.DataFrame(boston.data)
bos.columns = boston.feature_names
import matplotlib.font_manager as fm
myfont = fm.FontProperties(fname='C:/Windows/Fonts/msyh.ttc')
plt.scatter(bos.RM, bos.PRICE)
plt.xlabel(u'住宅平均房间数', fontproperties=myfont)
plt.ylabel(u'房屋价格', fontproperties=myfont)
plt.title(u'RM与PRICE的关系', fontproperties=myfont