《Hands-On Machine Learning with Scikit-Learn and TensorFlow》 学习笔记第五篇----正则线性模型

这篇学习笔记介绍了正则化线性模型,包括岭回归、套索回归和弹性网络。岭回归通过添加L2范数正则项来防止过拟合;套索回归利用L1范数实现特征选择,产生稀疏模型;弹性网络结合了岭回归和套索回归的优点,适用于相关特征场景。此外,还提到了早期停止法作为另一种正则化策略,并给出了选择模型的建议。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >


对线性模型来说,正则化通常通过约束模型的权重来实现。接下来我们将会使用岭回归(Ridge Regression)、套索回归(LassoRegression)及弹性网络(Elastic Net)这三种不同的实现方法对权重进行约束。

一、岭回归(Ridge Regression)

岭回归(也叫作吉洪诺夫正则化)是线性回归的正则化版:在成本函数中添加一个等于 的正则项。这使得学习中的算法不仅需要拟合数据,同时还要让模型权重保持最小。注意,正则项只能在训练的时候添加到成本函数中,一旦训练完成,你需要使用未经正则化的性能指标来评估模型性能。

在这里插入图片描述
超参数α控制的是对模型进行正则化的程度。如果α=0,则岭回归就是线性模型。如果α非常大,那么所有的权重都将非常接近于零,这里偏置项 θ 0 θ_0 θ0没有正则化。如果我们将w定义为特征权重的向量( θ 1 θ_1 θ1 θ n θ_n θn) , 那么正则项即等于1/2( ∣ ∣ w ∣ ∣ 2 ||w||^2 w2) 2其中 ∣ ∣ w ∣ ∣ 2 ||w||^2 w2为权重向量的 l 2 l_2 l2范数,所以岭回归相当于在成本函数上加了一个正则项(权重向量的 l 2 l_2 l2范数)
要点:
在执行岭回归之前, 必须对数据进行缩放(例如使用StandardScaler) , 因为它对输入特征的大小非常敏感,大多数正则化模型都是如此
在这里插入图片描述
使用Scikit-Learn执行闭式解的岭回归,利用André-Louis Cholesky的矩阵因式分解法

from sklearn.linear_model import Ridge
from sklearn import datasets
iris=datasets.load_iris()
x=iris.data
y=iris.target
ridge_reg = Ridge(alpha=1, solver="cholesky")
ridge_reg.fit(x, y)
print (ridge_reg.predict([[4.6, 3.1, 1.5, 0.2]]))

二、套索回归

线性回归的另一种正则化, 叫作最小绝对收缩和选择算子回归(Least Absolute Shrinkage and Selection Operator Regression, 简称Lasso回归, 或套索回归) 。 与岭回归一样, 它也是向成本函数增加一个正则项, 但是它增加的是权重向量的 l 1 l_1 l1范数
在这里插入图片描述
Lasso回归的一个重要特点是它倾向于完全消除掉最不重要特征的权重(也就是将它们设置为零),Lasso回归会自动执行特征选择并输出一个稀疏模型(即只有很少的特征有非零权重)

from sklearn.linear_model import Lasso
lasso_reg = Lasso(alpha=0.1)
lasso_reg.fit(x, y)
print (lasso_reg.predict([[4.6, 3.1, 1.5, 0.2]]))

三、弹性网络

弹性网络是岭回归与Lasso回归之间的中间地带。其正则项就是岭回归和Lasso回归的正则项的混合,混合比例通过r来控制。当r=0时,弹性网络即等同于岭回归,而当r=1时,即相当于Lasso回归
在这里插入图片描述
使用Scikit-Learn的ElasticNet的小例子( l 1 l_1 l1_ratio对应混合比例 r)

from sklearn.linear_model import ElasticNet
elastic_net = ElasticNet(alpha=0.1, l1_ratio=0.5)
elastic_net.fit(x, y)
print (elastic_net.predict([[4.6, 3.1, 1.5, 0.2]]))

四、早期停止法

对于梯度下降这一类迭代学习的算法, 还有一个与众不同的正则
化方法, 就是在验证误差达到最小值时停止训练, 该方法叫作早期停
止法
在这里插入图片描述

五、如何选择

  • 有正则化的模型通常比没有正则化的模型表现得更好,所以应该优先选择岭回归而不是普通的线性回归。
  • Lasso回归使用1惩罚函数,往往倾向于将不重要的特征权重降至零。这将生成一个除了最重要的权重之外,其他所有权重都为零的稀疏模型。这是自动执行特征选择的一种方法,如果你觉得只有少数几个特征是真正重要的,这不失为一个非常好的选择,但是当您不确定的时候,应该更青睐岭回归模型。
  • ·弹性网络比Lasso更受欢迎,因为某些情况下Lasso可能产生异常表现(例如当多个特征强相关,或者特征数量比训练实例多时)。并且,弹性网络会添加一个额外的超参数来对模型进行调整。如果你想使用Lasso,只需要将弹性网络的 l 1 l_1 l1_ratio设置为接近1即可
电动汽车数据集:2025年3K+记录 真实电动汽车数据:特斯拉、宝马、日产车型,含2025年电池规格和销售数据 关于数据集 电动汽车数据集 这个合成数据集包含许多品牌和年份的电动汽车和插电式车型的记录,捕捉技术规格、性能、定价、制造来源、销售和安全相关属性。每一行代表由vehicle_ID标识的唯一车辆列表。 关键特性 覆盖范围:全球制造商和车型组合,包括纯电动汽车和插电式混合动力汽车。 范围:电池化学成分、容量、续航里程、充电标准和速度、价格、产地、自主水平、排放、安全等级、销售和保修。 时间跨度:模型跨度多年(包括传统和即将推出的)。 数据质量说明: 某些行可能缺少某些字段(空白)。 几个分类字段包含不同的、特定于供应商的值(例如,Charging_Type、Battery_Type)。 各列中的单位混合在一起;注意kWh、km、hr、USD、g/km和额定值。 列 列类型描述示例 Vehicle_ID整数每个车辆记录的唯一标识符。1 制造商分类汽车品牌或OEM。特斯拉 型号类别特定型号名称/变体。型号Y 与记录关联的年份整数模型。2024 电池_类型分类使用的电池化学/技术。磷酸铁锂 Battery_Capacity_kWh浮充电池标称容量,单位为千瓦时。75.0 Range_km整数表示充满电后的行驶里程(公里)。505 充电类型主要充电接口或功能。CCS、NACS、CHAdeMO、DCFC、V2G、V2H、V2L Charge_Time_hr浮动充电的大致时间(小时),上下文因充电方法而异。7.5 价格_USD浮动参考车辆价格(美元).85000.00 颜色类别主要外观颜色或饰面。午夜黑 制造国_制造类别车辆制造/组装的国家。美国 Autonomous_Level浮点自动化能力级别(例如0-5),可能包括子级别的小
内容概要:本文详细介绍了IEEE论文《Predefined-Time Sensorless Admittance Tracking Control for Teleoperation Systems With Error Constraint and Personalized Compliant Performance》的复现与分析。论文提出了一种预定义时间的无传感器导纳跟踪控制方案,适用于存在模型不确定性的遥操作系统。该方案通过具有可调刚度参数的导纳结构和预定义时间观测器(PTO),结合非奇异预定义时间终端滑模流形和预定义时间性能函数,实现了快速准确的导纳轨迹跟踪,并确保误差约束。文中详细展示了系统参数定义、EMG信号处理、预定义时间观测器、预定义时间控制器、可调刚度导纳模型及主仿真系统的代码实现。此外,还增加了动态刚度调节器、改进的广义动量观测器和安全约束模块,以增强系统的鲁棒性和安全性。 适合人群:具备一定自动化控制理论基础和编程能力的研究人员、工程师,尤其是从事机器人遥操作、人机交互等领域工作的专业人士。 使用场景及目标:①理解预定义时间控制理论及其在遥操作系统中的应用;②掌握无传感器力观测技术,减少系统复杂度;③学习如何利用肌电信号实现个性化顺应性能调整;④探索如何在保证误差约束的前提下提高系统的响应速度和精度。 阅读建议:本文内容涉及较多的数学推导和技术细节,建议读者先熟悉基本的控制理论和Python编程,重点理解各个模块的功能和相互关系。同时,可以通过运行提供的代码示例,加深对理论概念的理解,并根据自身需求调整参数进行实验验证。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值