文章目录
线性回归表示
注意区分,一般lr缩写表示逻辑回归,线性回归不要用这个缩写
模型参数
属性
方法
补充:0-1规划(去量纲/归约)不受单位的影响
需要去掉量纲,公式如下:
!实战代码
基础操作(导包,导数据,生成xy,训练集测试集划分,准确度)
调参
还有就是,这里准确度用的数据是x_test 和 y_test ,要把上面代码的score写成'score':linear.score(x_test,y_test)
最优参数
最优参数看准确率score
最高的,有两个都是0.668759,都可以选,
但是,实际工作中,fit_intercept=True
表示要截距 ,normaliza = False
表示不进行归一化(归约),不进行归一化可以少一步计算量
错误鉴赏
True
和 False
在python里是关键字,不加引号
DataFrame
应该在循环外面
机器学习错误3 忘记使用fit() 导致报错`AttributeError: ‘LinearRegression‘ object has no attribute ‘coef_‘
完整boston房价数据调参代码
导入包
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
import pandas as pd #后期用DataFrame时补加上
导入数据
#波士顿房价数据集
boston = datasets.load_boston() #系统自带数据
boston.keys()
查看x和y
x=boston.data
x
y=boston.target
y
分裂测试集和训练集
x_train, x_test, y_train, y_test = train_test_split( x, y, test_size=0.2, random_state=42)
调参(在循环里建模,字典,追加,DataFrame显示)
result = []
for inercept in [True,False]:
for norm in [True,False]:
linear = LinearRegression(fit_intercept=inercept,normalize=norm)
linear.fit(x_train,y_train)
d = {'fit_intercept':inercept,'normalize':norm,'score':linear.score(x_test,y_test),'coef':linear.coef_ ,'intercept':linear.intercept_}
result.append(d)
result_df = pd.DataFrame(result)
result_df