第八章 正则化

过拟合是指模型在训练数据上表现良好,但在新数据上表现较差的现象。它通常发生在变量多而样本少的情况。解决过拟合的方法包括减少变量和使用正则化。正则化通过添加惩罚项限制参数大小,防止模型过于复杂。线性回归和Logistic回归都可以通过梯度下降和正规方程进行正则化,以平衡拟合训练集和避免过拟合。

1 过拟合

什么是过拟合问题

      什么是过拟合问题?顾名思义,就是模拟函数过度拟合训练集导致的问题,这会导致所得的函数过于庞大,变量过多,虽然很好的拟合了已有的数据,但是不能很好地预测新数据,不能泛化地适用于新样本,用图像表示这种情况:

      

      以上的第一个函数出现了欠拟合的问题,第二个函数所得的结果相当不错,第三个函数用到了五个参数,变量的最高阶达到了四阶,表面上拟合了所有样本,但是这条曲线上下波动,犯了过拟合的错误。

解决过拟合问题

      过拟合问题往往出现在变量较多而训练样本较少的情况下,解决方法通常有两种:

      1,尽可能多的减少变量数量,但是同样舍弃了一部分问题的信息。

      2,正则化,保留所有特征变量,但是相应的减少变量阶数或者调整模型参数\theta 的大小,这种方法既消除了过拟合现象,同时充分利用了变量信息。

2 代价函数

      上述函数中的 就是正则化项,他会控制每个参数的值,其中的\lambda 被称为正则化参数,它会动态调整拟合训练集和减小参数两个目的,使模型不至于出现过拟合现象,

3 线性回归正则化

1 梯度下降正则化

      对上式进行化简得到:

      上式中始终小于1,因此整个梯度下降过程在每次更新前都会将参数缩小,再进行梯度下降过程,但需要注意的是J始终是大于1的整数,\theta _{0} 的更新公式不变。

2 正规方程正则化

      

      如上即正规方程正则化后的表达式,另外,在正规方程的学习时,有一个前提X^{T}X 应当可逆,但是在上述公式中只要\lambda 大于零就一定可逆,因此回避了可逆与不可逆问题的讨论。

4 Logistic回归正则化

      正则化后Logistic回归的代价函数为:

      Logistic回归梯度下降算法正则化与线性回归正则化的关系与两者的梯度下降算法公式相同,Logistic回归梯度下降正则化公式与线性回归正则化相同:

      这里同样要注意,两者的表达式虽然相同,但由于两者的假设函数不同所以是完全不同的两个公式,另外\theta _{0} 同样不参与任何正则化。

      

【顶级EI完整复现】【DRCC】考虑N-1准则的分布鲁棒机会约束低碳经济调度(Matlab代码实现)内容概要:本文介绍了名为《【顶级EI完整复现】【DRCC】考虑N-1准则的分布鲁棒机会约束低碳经济调度(Matlab代码实现)》的技术资源,聚焦于电力系统中低碳经济调度问题,结合N-1安全准则与分布鲁棒机会约束(DRCC)方法,提升调度模型在不确定性环境下的鲁棒性和可行性。该资源提供了完整的Matlab代码实现,涵盖建模、优化求解及仿真分析全过程,适用于复杂电力系统调度场景的科研复现与算法验证。文中还列举了大量相关领域的研究主题与代码资源,涉及智能优化算法、机器学习、电力系统管理、路径规划等多个方向,展示了广泛的科研应用支持能力。; 适合人群:具备一定电力系统、优化理论和Matlab编程基础的研究生、科研人员及从事能源调度、智能电网相关工作的工程师。; 使用场景及目标:①复现高水平期刊(如EI/SCI)关于低碳经济调度的研究成果;②深入理解N-1安全约束与分布鲁棒优化在电力调度中的建模方法;③开展含新能源接入的电力系统不确定性优化研究;④为科研项目、论文撰写或工程应用提供可运行的算法原型和技术支撑。; 阅读建议:建议读者结合文档提供的网盘资源,下载完整代码与案例数据,按照目录顺序逐步学习,并重点理解DRCC建模思想与Matlab/YALMIP/CPLEX等工具的集成使用方式,同时可参考文中列出的同类研究方向拓展研究思路。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值