岭回归理论及代码实现

君诺

已于 2023-03-09 16:41:04 修改

阅读量408

点赞数

CC 4.0 BY-SA版权

分类专栏： SKLEARN 文章标签： scikit-learn

于 2023-03-06 16:22:08 首次发布

本文链接：https://blog.youkuaiyun.com/m0_37772713/article/details/129363500

SKLEARN 专栏收录该内容

2 篇文章

订阅专栏

文章详细介绍了岭回归的概念，它通过添加回归系数的二范数防止过拟合，与线性和Lasso回归进行对比。提供了使用numpy手动实现岭回归的代码以及利用sklearn的Ridge模型的示例，强调了两者结果的一致性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

岭回归的模型可以写作

$\text{[math]}$

与一般的线性回归相比, 岭回归加入了回归项 $\text{[math]}$ 系数 $\text{[math]}$ 的二范数, 其中

$\text{[math]}$ , $\text{[math]}$

这样做是为了防止线性回归过程发生的过拟合现象. 直观点看, 其将 $\text{[math]}$ 的分量限制在了一个以圆点为中心的圆内. 而与Lasso回归相比, 该模型更具有稳定性.

岭回归的模型求解可以通过直接求梯度获得, 也就是

$\text{[math]}$

由此可求得:

$\text{[math]}$

如此便可得其代码(此代码只是为了更好的了解其求解过程)

import numpy as np
# 自动生成求解数据
from sklearn.datasets import make_regression


def ridge_recurrence(x_train, y_train, lam):
    mattemp = np.dot(x_train.T, x_train) + lam * np.eye(x_train.shape[1])
    # 判断矩阵是否可逆
    if np.linalg.det(mattemp) == 0:
        print("This matrix can not inverse!")
        return
    return np.dot(np.linalg.inv(mattemp), np.dot(x_train.T, y_train))


if __name__ == '__main__':
    X, y = make_regression(200, 5, noise=1)
    omega = ridge_recurrence(X, y, 1)
    print(omega)

同样的可以通过调用sklearn.liner_model中的Ridge对其进行实现, 具体代码如下

from sklearn.datasets import make_regression
from sklearn.linear_model import Ridge


if __name__ == '__main__':
    X, y = make_regression(200, 5, noise=1)
    model = Ridge(alpha=1)
    model.fit(X, y)
    print(model.coef_)

比较两个方式的结果有