机器学习之广义线性模型（一）

最新推荐文章于 2024-07-23 08:32:15 发布

原创最新推荐文章于 2024-07-23 08:32:15 发布 · 841 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#机器学习 #sklearn #线性回归

机器学习专栏收录该内容

7 篇文章

订阅专栏

本文详细介绍了线性模型的各种形式，包括普通最小二乘法、岭回归、Lasso等，并通过Python代码实例展示了如何使用这些模型进行数据拟合。

部署运行你感兴趣的模型镜像

1.1 广义线性模型

1.1.1 普通最小二乘法

最小二乘法很经常用在线性回归Linear Regression, $\hat{y}=Xw+b$ 中，LR是用来拟合一个

w = (w 1, w 2, w 3, . . .)

$w=(w_1, w_2, w_3, ...)$ 的线性模型，而最小二乘法在其中的作用是用来计算预测值和实际值之间的残差平法和，并且使其最小,其中loss function为：

J(w,b)=12m∑mi=1(y^(i)−y(i))2 J ( w , b ) = 1 2 m ∑ i = 1 m ( y ^ ( i ) − y ( i ) ) 2 $J(\boldsymbol{w},b) = \frac{1}{2m} \sum_{i=1}^m \Big(\hat{y}^{(i)} - y^{(i)} \Big)^2$

然后再在梯度下降法Gradient Descent Optimization对系数w进行优化:
$\frac{\partial J}{\partial w_j} = \frac{1}{m}\sum_{i=1}^m \Big( \hat{y}^{(i)} - y^{(i)} \Big) x^{(i)}_j$

$\frac{\partial J}{\partial b} = \frac{1}{m}\sum_{i=1}^m \Big( \hat{y}^{(i)} - y^{(i)} \Big)$
说明：
$\hat{y}^{(i)}表示第i个样本的预测值$
$y^{(i)} 表示第i个样本的真实值$
$x^{(i)}_j$ 指的是第i个样本的第j个特征的值。

from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, r2_score  # 模型评价指标
import matplotlib.pyplot as plt
import numpy as np

# 生成500个点数据
X = 2 * np.random.rand(500, 1)
y = 5 + 3 * X + np.random.randn(500, 1)

plt.scatter(X, y)
plt.title("Dataset")
plt.xlabel('X')
plt.ylabel('y')
plt.show()

# 下面使用Sklearn中的线性回归模型进行拟合
lr = LinearRegression()
lr.fit(X, y)

# 再使用这个模型进行数据的预测
y_pred = lr.predict(X)
# 输出这个模型拟合的系数
print('The cofficients of lr is : ', lr.coef_)
# 计算mean squared error
print('The mse of the training sets is : ', mean_squared_error(y_true=y, y_pred=y_pred))

# 将模型拟合的图画出来
plt.scatter(X ,y, color='orange')
plt.plot(X, y_pred, color='red', linewidth=1)   # 拟合直线
plt.xticks([])
plt.yticks([])

plt.show()

这里写图片描述
由图可知，拟合的直线正好符合散点图的趋向

1.1.2 岭回归Ridge Regression

岭回归是线性回归的一个改善的版本，对系数施加L2正则：

m i n w ∣ ∣ X w - y ∣ ∣ 22 + α ∣ ∣ w ∣ ∣ 22

$min_w\mid\mid{Xw-y}\mid\mid_2^2 + \alpha\mid\mid{w}\mid\mid_2^2$
其中α>=0, 是控制系数的收缩量的发杂性参数，α值越大，收缩量也就越大。
梯度下降在Ridge上的运用就不再做详细的推导，同学们可以按照上面的Linear Regression的推导进行练习，不难的。

from sklearn.linear_model import Ridge

## 引用上面的数据
ridge = Ridge(alpha=0.5)
ridge.fit(X, y)
# 再使用这个模型进行数据的预测
y_pred = ridge.predict(X)
# 输出这个模型拟合的系数
print('The cofficients of lr is : ', ridge.coef_)
# 计算mean squared error
print('The mse of the training sets is : ', mean_squared_error(y_true=y, y_pred=y_pred))

# 将模型拟合的图画出来
plt.scatter(X ,y, color='orange')
plt.plot(X, y_pred, color='red', linewidth=1)   # 拟合直线
plt.xticks([])
plt.yticks([])

plt.show()

在小型的数据集上，可能与无正则项的Linear Regression相差不大，但是加入正则项是可以是模型更加的鲁棒。

添加Cross Validation找出更加优秀的alpha系数。

# 我们还可以为岭回归添加交叉性验证
from sklearn.linear_model import RidgeCV

rid_cv = RidgeCV()   # alpha=(0.1, 1.0, 10.0)  # 通过cv找到更好的alpha系数
rid_cv.fit(X, y)
# 再使用这个模型进行数据的预测
y_pred = rid_cv.predict(X)
# 输出这个模型拟合的系数
print('The cofficients of lr is : ', rid_cv.coef_)
# 计算mean squared error
print('The mse of the training sets is : ', mean_squared_error(y_true=y, y_pred=y_pred))

1.1.3 Lasso

Lasso也是线性回归的一个改善模型，不过这个是加入了L1正则项，以获得稀疏解：

m i n w ∣ ∣ X w - y ∣ ∣ 22 + α ∣ ∣ w ∣ ∣ 1

$min_w\mid\mid{Xw-y}\mid\mid_2^2 + \alpha\mid\mid{w}\mid\mid_1$

from sklearn.linear_model import Lasso
reg = Lasso(alpha=0.1)
reg.fit(X, y)
# 再使用这个模型进行数据的预测
y_pred = reg.predict(X)
# 输出这个模型拟合的系数
print('The cofficients of lr is : ', reg.coef_)
# 计算mean squared error
print('The mse of the training sets is : ', mean_squared_error(y_true=y, y_pred=y_pred))

本人github，欢迎star/follow：https://github.com/Gary-Deeplearning/sklearn-study-note
这里写图片描述

您可能感兴趣的与本文相关的镜像

Python3.10

Conda

Python

Python 是一种高级、解释型、通用的编程语言，以其简洁易读的语法而闻名，适用于广泛的应用，包括Web开发、数据分析、人工智能和自动化脚本