第八章 正则化

过拟合是指模型在训练数据上表现良好,但在新数据上表现较差的现象。它通常发生在变量多而样本少的情况。解决过拟合的方法包括减少变量和使用正则化。正则化通过添加惩罚项限制参数大小,防止模型过于复杂。线性回归和Logistic回归都可以通过梯度下降和正规方程进行正则化,以平衡拟合训练集和避免过拟合。

1 过拟合

什么是过拟合问题

      什么是过拟合问题?顾名思义,就是模拟函数过度拟合训练集导致的问题,这会导致所得的函数过于庞大,变量过多,虽然很好的拟合了已有的数据,但是不能很好地预测新数据,不能泛化地适用于新样本,用图像表示这种情况:

      

      以上的第一个函数出现了欠拟合的问题,第二个函数所得的结果相当不错,第三个函数用到了五个参数,变量的最高阶达到了四阶,表面上拟合了所有样本,但是这条曲线上下波动,犯了过拟合的错误。

解决过拟合问题

      过拟合问题往往出现在变量较多而训练样本较少的情况下,解决方法通常有两种:

      1,尽可能多的减少变量数量,但是同样舍弃了一部分问题的信息。

      2,正则化,保留所有特征变量,但是相应的减少变量阶数或者调整模型参数\theta 的大小,这种方法既消除了过拟合现象,同时充分利用了变量信息。

2 代价函数

      上述函数中的 就是正则化项,他会控制每个参数的值,其中的\lambda 被称为正则化参数,它会动态调整拟合训练集和减小参数两个目的,使模型不至于出现过拟合现象,

3 线性回归正则化

1 梯度下降正则化

      对上式进行化简得到:

      上式中始终小于1,因此整个梯度下降过程在每次更新前都会将参数缩小,再进行梯度下降过程,但需要注意的是J始终是大于1的整数,\theta _{0} 的更新公式不变。

2 正规方程正则化

      

      如上即正规方程正则化后的表达式,另外,在正规方程的学习时,有一个前提X^{T}X 应当可逆,但是在上述公式中只要\lambda 大于零就一定可逆,因此回避了可逆与不可逆问题的讨论。

4 Logistic回归正则化

      正则化后Logistic回归的代价函数为:

      Logistic回归梯度下降算法正则化与线性回归正则化的关系与两者的梯度下降算法公式相同,Logistic回归梯度下降正则化公式与线性回归正则化相同:

      这里同样要注意,两者的表达式虽然相同,但由于两者的假设函数不同所以是完全不同的两个公式,另外\theta _{0} 同样不参与任何正则化。

      

Matlab基于粒子群优化算法及鲁棒MPPT控制器提高光伏并网的效率内容概要:本文围绕Matlab在电力系统优化与控制领域的应用展开,重点介绍了基于粒子群优化算法(PSO)和鲁棒MPPT控制器提升光伏并网效率的技术方案。通过Matlab代码实现,结合智能优化算法与先进控制策略,对光伏发电系统的最大功率点跟踪进行优化,有效提高了系统在不同光照条件下的能量转换效率和并网稳定性。同时,文档还涵盖了多种电力系统应用场景,如微电网调度、储能配置、鲁棒控制等,展示了Matlab在科研复现与工程仿真中的强大能力。; 适合人群:具备一定电力系统基础知识和Matlab编程能力的高校研究生、科研人员及从事新能源系统开发的工程师;尤其适合关注光伏并网技术、智能优化算法应用与MPPT控制策略研究的专业人士。; 使用场景及目标:①利用粒子群算法优化光伏系统MPPT控制器参数,提升动态响应速度与稳态精度;②研究鲁棒控制策略在光伏并网系统中的抗干扰能力;③复现已发表的高水平论文(如EI、SCI)中的仿真案例,支撑科研项目与学术写作。; 阅读建议:建议结合文中提供的Matlab代码与Simulink模型进行实践操作,重点关注算法实现细节与系统参数设置,同时参考链接中的完整资源下载以获取更多复现实例,加深对优化算法与控制系统设计的理解。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值