带正则项的线性回归Regression （linear regression with regulation）

最新推荐文章于 2025-09-09 16:14:00 发布

原创

最新推荐文章于 2025-09-09 16:14:00 发布 · 3.9k 阅读

·

1

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#正则 #线性回归

本文探讨了如何使用带有正则项的线性回归来避免过拟合现象。通过非线性函数的线性化，将问题转化为多元线性回归，并引入正则项（Regulation）来限制模型复杂度。实验表明，正则化参数λ的增大导致θ参数减小，从而平衡模型的拟合与泛化能力。λ=0时可能产生过拟合，而λ=1和10分别展示出适度和欠拟合的效果。

问题描述：

一直7个样本点（x，y）；散点图如下；现采用函数拟合已找到一个函数f(x);使其跟好的估计真实的x和y的函数关系。

从直观分析可以得出，因变量x和果变量y不成线性关系，故采用非线性函数来h(x)来拟合；有图像观察和经验，现在用最高次为5次（4次或者其他次幂也可以）的多项式作为拟合函数h(x)的结构框架。

非线性回归的线性化：

由上述拟合函数可以看出，我们有x0，x1，x2……x5 （x2代表x的2次方，由于格式的关系，没有显示上标，下同）共计6个特征量；所以可以根据原始样本数据x，通过x的平方，立方……运算，计算出x0，x1，x2……x5各项的值，又由于拟合函数h(x)的各项系数theta（θ的引文字母表示）为常数，所以最后问题转化为多元线性回归问题。

即：已知样本点（x1，x2，x3 ，x4 ，x5，y），求拟合函数h(x)的系数theta

正则项（Regulation）：

由参数theta的平方和与权重项参数lambda组成

因为在机器学习的一些模型中，如果模型的参数太多，而训练样本又太少的话，这样训练出来的模型很容易产生过拟合现象。因此在模型的损失函数中，需要对模型的参数进行“惩罚”，这样的话这些参数就不会太大，而越小的参数说明模型越简单，越简单的模型则越不容易产生过拟合现象。添加正则项后，应用梯度下降算法迭代优化计算时，如果参数theta比较大，则此时的正则项数值也比较大，那么在下一次更新参数时，参数削减的也比较大。可以使拟合结果看起来更平滑，不至于过拟合。

试验计算：

normalequation（标准公式法）和梯度下降法

标准公式法以及代码，详见博客：

最低0.47元/天解锁文章

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。