更多支持向量机的理论知识查看:支持向量机
该数据集来源于1978年美国某经济学杂志上。该数据集包含若干波士顿房屋的价格及其各项数据,每个数据项包含14个数据,分别是房屋均价及周边犯罪率、是否在河边等相关信息,其中最后一个数据是房屋均价。
代码实战
这里我们说简单点儿,我们从sklearn中的datasets中导入数据集,导入需要的库,将数据集进行划分,再标准化
from sklearn.datasets import load_boston
boston = load_boston()
from sklearn.cross_validation import train_test_split
import numpy as np
X = boston.data
y = boston.target
X_train,X_test,Y_train,Y_test = train_test_split(X,y,test_size=0.25,random_state=33)
from sklearn.preprocessing import StandardScaler
ss_X = StandardScaler()
ss_