机器学习14 线性回归代码实现（boston房价）

最新推荐文章于 2023-06-13 15:25:06 发布

dd112474

最新推荐文章于 2023-06-13 15:25:06 发布

阅读量860

点赞数

分类专栏：机器学习文章标签：机器学习线性回归 python

本文链接：https://blog.youkuaiyun.com/dd112474/article/details/126595411

版权

机器学习专栏收录该内容

21 篇文章

订阅专栏

文章目录

线性回归表示

注意区分，一般lr缩写表示逻辑回归，线性回归不要用这个缩写

模型参数

在这里插入图片描述

属性

在这里插入图片描述

方法

在这里插入图片描述

补充：0-1规划（去量纲/归约）不受单位的影响

在这里插入图片描述
需要去掉量纲，公式如下：

！实战代码

基础操作（导包，导数据，生成xy，训练集测试集划分，准确度）

在这里插入图片描述

调参

在这里插入图片描述

还有就是，这里准确度用的数据是x_test 和 y_test ,要把上面代码的score写成'score':linear.score(x_test,y_test)

最优参数

在这里插入图片描述
最优参数看准确率score最高的，有两个都是0.668759，都可以选，
但是，实际工作中，fit_intercept=True 表示要截距，normaliza = False表示不进行归一化（归约），不进行归一化可以少一步计算量

错误鉴赏

在这里插入图片描述
True 和 False 在python里是关键字，不加引号
DataFrame应该在循环外面

机器学习错误3 忘记使用fit() 导致报错`AttributeError: ‘LinearRegression‘ object has no attribute ‘coef_‘

完整boston房价数据调参代码

导入包

from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
import pandas as pd #后期用DataFrame时补加上

导入数据

#波士顿房价数据集
boston = datasets.load_boston() #系统自带数据
boston.keys()

查看x和y

x=boston.data
x

y=boston.target
y

分裂测试集和训练集

x_train, x_test, y_train, y_test = train_test_split( x, y, test_size=0.2, random_state=42)

调参（在循环里建模，字典，追加，DataFrame显示）

result = []
for inercept in [True,False]:
    for norm in [True,False]:
        linear = LinearRegression(fit_intercept=inercept,normalize=norm)
        linear.fit(x_train,y_train)
        
        
        d = {'fit_intercept':inercept,'normalize':norm,'score':linear.score(x_test,y_test),'coef':linear.coef_ ,'intercept':linear.intercept_}
        result.append(d)
    
result_df = pd.DataFrame(result)
result_df