从线性回归谈到岭回归lasso回归再到结构风险最小化和参数缩减

       回归和分类是机器学习算法所要解决的两个主要问题。分类大家都知道,模型的输出值是离散值,对应着相应的类别,通常的简单分类问题模型输出值是二值的,也就是二分类问题。但是回归就稍微复杂一些,回归模型的输出值是连续的,也就是说,回归模型更像是一个函数,该函数通过不同的输入,得到不同的输出。

       那么,什么是线性回归,什么是非线性回归呢?

线性回归与非线性回归

       前面说了,我们的回归模型是一个函数是吧,那么线性回归就是模型函数是由若干个基本函数线性加权得到的函数。也就是每一个基本函数前面都有一个权值来调和自己对于整个模型函数的重要性。然后,非线性函数就是各个基本函数并不是以线性加权形式结合。在线性回归模型里面有一大类,叫广义线性模型GLM,这里先不讲。

       线性回归模型中的各个基函数如何选择,模型的函数就会有不同的结果。而且基函数的选择有时可以将线性模型扩展到一般的非线性形式,只要你将基函数定义为一个非线性函数就好啦。虽然通常我们都是将每个基函数定义为输入向量数据每一维特征的一次方函数,也就是输入数据的每一维特征取值,但是我们仍然有必要聊聊其他的情况,这样才能感觉到线性回归的强大。

  •        首先,假设模型由N个基函数线性加权构成,我们可以在第一个取输入x的一次方,第二个取x的二次方,。。。第N个取N次方,这样模型就成为了x的多项式形式。这样会导致一个问题,每一个基函数的输入特征值会影响到其他基函数的值
### Lasso 回归岭回归的区别及应用场景 #### 定义与目标 Lasso 回归(Least Absolute Shrinkage and Selection Operator)岭回归(Ridge Regression)都属于正则化方法,旨在解决多重共线性过拟合问题。然而,它们的核心区别在于如何处理特征权重。 - 岭回归通过向损失函数添加 \(L_2\) 正则项来缩小系数的大小[^1]。这有助于减少模型复杂度并提高泛化能力。 - Lasso 回归则是通过引入 \(L_1\) 正则项实现稀疏解,即某些特征的系数会被直接缩减至零。 #### 数学表达形式 两种方法都可以看作是对标准最小二乘法的一种扩展: 对于岭回归,其优化目标可以表示为: \[ \min_{w} \left( \|Xw - y\|_2^2 + \lambda \|w\|_2^2 \right) \] 而对于 Lasso 回归,则有: \[ \min_{w} \left( \|Xw - y\|_2^2 + \lambda \|w\|_1 \right) \] 其中,\(X\) 是数据矩阵,\(y\) 是标签向量,\(w\) 表示参数向量,而 \(\lambda\) 控制着正则化的强度[^2]。 #### 特征选择的能力 由于采用不同的范数约束方式,在实际应用中两者表现出显著差异: - **Lasso** 更适合于高维数据集中的自动特征选择场景,因为它能够有效地将不重要变量对应的权值设为0。 - 相较之下,尽管 **Ridge** 可以降低所有系数绝对值从而缓解多共线性影响,但它不会完全消除任何单一维度的影响。 #### 应用案例分析 当面临具体任务时需考虑如下因素决定选用哪种技术更佳: - 如果预期只有少数几个强相关因子主导输出变化趋势的话,Lasso可能是更好的选项因为它的特性允许构建简洁明了易于解释的模型结构. - 对那些存在广泛相互作用或者几乎所有输入都有贡献程度各异的情况来说,Ridge往往表现得更为稳健可靠一些. 另外值得注意的是,有时候也可以尝试组合这两种策略形成弹性网络(Elastic Net),它综合了两者的优点既保留了一定水平上的压缩效果又具备一定程度的选择功能. ```python from sklearn.linear_model import Ridge, Lasso import numpy as np # Example usage of Ridge Regression ridge = Ridge(alpha=1.0) ridge.fit(X_train, y_train) # Example usage of Lasso Regression lasso = Lasso(alpha=0.1) lasso.fit(X_train, y_train) ```
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值