最简单的线性回归模型李烨_模型

最新推荐文章于 2024-12-09 20:22:52 发布

原创最新推荐文章于 2024-12-09 20:22:52 发布 · 285 阅读

0 ·

CC 4.0 BY-SA版权

机器学习同时被 3 个专栏收录

4 篇文章

订阅专栏

人工智能

3 篇文章

订阅专栏

线性回归

2 篇文章

订阅专栏

该博客介绍了一个取自gitchat李烨老师课程的模型，旨在弄清楚工作年龄与薪资间的函数关系。先对两者关系做出假设，探讨了线性回归能解决确定模型后使误差最小的参数值，不能解决模型选取问题，还给出代码链接，最后提及预测结果。

标题

本模型取自gitchat 中李烨老师的课程，

本模型要解决的问题

如下图，左侧是工作年龄，右侧是薪资，
我们想弄清楚 y 与 x 间的函数关系
在这里插入图片描述

必要的假设

我们必须先对y 与 x 的关系做出假设，
假设： y = a + b x,

线性回归能做什么，不能做什么

注意，线性回归能解决的问题是：在模型确定下来后， a,b值为多少时，误差最小
不能解决的问题是：模型到底取 y =a+bx ? 还是取 y=a+bx+cx²？

代码

#version:py3
#author:kaka

#导包
import matplotlib.pyplot as plt
import numpy as np
from sklearn import linear_model


experiences = np.array([0,1,2,3,4,5,6,7,8,9,10])
salaries = np.array([103100, 104900, 106800, 108700, 110400, 112300, 114200, 116100, 117800, 119700, 121600])

# 将特征数据集分为训练集和测试集，前7个用于测试集，后面用于训练集
X_train =experiences[:7].reshape(-1,1)
X_test = experiences[7:].reshape(-1,1)

# 把目标数据（特征对应的真实值）也分为训练集和测试集
Y_train = salaries[:7]
Y_test = salaries[7:]

# 创建线性回归模型
regr = linear_model.LinearRegression()

# 用训练集训练模型，训练后模型的参数保存在regr模型对象中
regr.fit(X_train, Y_train)

# 用训练得出的模型进行预测
Y_predict = regr.predict(X_test)

# 将测试结果以图的方式显示出来
plt.scatter(X_test, Y_test,  color='black')	#散点图，打印训练集
plt.plot(X_test, Y_predict, color='blue', linewidth=3)	# 连线，打印测试集（测试集就是模型的预测结果）

# 打印模型训练的结果 y=θ0+θ1x  中的θ0，和θ1
print(regr.coef_)	#截距
print(regr.intercept_)	#参数列表