第八章 正则化

过拟合是指模型在训练数据上表现良好,但在新数据上表现较差的现象。它通常发生在变量多而样本少的情况。解决过拟合的方法包括减少变量和使用正则化。正则化通过添加惩罚项限制参数大小,防止模型过于复杂。线性回归和Logistic回归都可以通过梯度下降和正规方程进行正则化,以平衡拟合训练集和避免过拟合。

1 过拟合

什么是过拟合问题

      什么是过拟合问题?顾名思义,就是模拟函数过度拟合训练集导致的问题,这会导致所得的函数过于庞大,变量过多,虽然很好的拟合了已有的数据,但是不能很好地预测新数据,不能泛化地适用于新样本,用图像表示这种情况:

      

      以上的第一个函数出现了欠拟合的问题,第二个函数所得的结果相当不错,第三个函数用到了五个参数,变量的最高阶达到了四阶,表面上拟合了所有样本,但是这条曲线上下波动,犯了过拟合的错误。

解决过拟合问题

      过拟合问题往往出现在变量较多而训练样本较少的情况下,解决方法通常有两种:

      1,尽可能多的减少变量数量,但是同样舍弃了一部分问题的信息。

      2,正则化,保留所有特征变量,但是相应的减少变量阶数或者调整模型参数\theta 的大小,这种方法既消除了过拟合现象,同时充分利用了变量信息。

2 代价函数

      上述函数中的 就是正则化项,他会控制每个参数的值,其中的\lambda 被称为正则化参数,它会动态调整拟合训练集和减小参数两个目的,使模型不至于出现过拟合现象,

3 线性回归正则化

1 梯度下降正则化

      对上式进行化简得到:

      上式中始终小于1,因此整个梯度下降过程在每次更新前都会将参数缩小,再进行梯度下降过程,但需要注意的是J始终是大于1的整数,\theta _{0} 的更新公式不变。

2 正规方程正则化

      

      如上即正规方程正则化后的表达式,另外,在正规方程的学习时,有一个前提X^{T}X 应当可逆,但是在上述公式中只要\lambda 大于零就一定可逆,因此回避了可逆与不可逆问题的讨论。

4 Logistic回归正则化

      正则化后Logistic回归的代价函数为:

      Logistic回归梯度下降算法正则化与线性回归正则化的关系与两者的梯度下降算法公式相同,Logistic回归梯度下降正则化公式与线性回归正则化相同:

      这里同样要注意,两者的表达式虽然相同,但由于两者的假设函数不同所以是完全不同的两个公式,另外\theta _{0} 同样不参与任何正则化。

      

内容概要:本文是一份针对2025年中国企业品牌传播环境撰写的《全网媒体发稿白皮书》,聚焦企业媒体发稿的策略制定、渠道选择与效果评估难题。通过分析当前企业面临的资源分散、内容同质、效果难量化等核心痛点,系统性地介绍了新闻媒体、央媒、地方官媒和自媒体四大渠道的特点与适用场景,并深度融合“传声港”AI驱动的新媒体平台能力,提出“策略+工具+落地”的一体化解决方案。白皮书详细阐述了传声港在资源整合、AI智能匹配、舆情监测、合规审核及全链路效果追踪方面的技术优势,构建了涵盖曝光、互动、转化与品牌影响力的多维评估体系,并通过快消、科技、零售等行业的实战案例验证其有效性。最后,提出了按企业发展阶段和营销节点定制的媒体组合策略,强调本土化传播与政府关系协同的重要性,助力企业实现品牌声量与实际转化的双重增长。; 适合人群:企业市场部负责人、品牌方管理者、公关传播从业者及从事数字营销的相关人员,尤其适用于初创期至成熟期不同发展阶段的企业决策者。; 使用场景及目标:①帮助企业科学制定媒体发稿策略,优化预算分配;②解决渠道对接繁琐、投放不精准、效果不可衡量等问题;③指导企业在重大营销节点(如春节、双11)开展高效传播;④提升品牌权威性、区域渗透力与危机应对能力; 阅读建议:建议结合自身企业所处阶段和发展目标,参考文中提供的“传声港服务组合”与“预算分配建议”进行策略匹配,同时重视AI工具在投放、监测与优化中的实际应用,定期复盘数据以实现持续迭代。
先展示下效果 https://pan.quark.cn/s/987bb7a43dd9 VeighNa - By Traders, For Traders, AI-Powered. Want to read this in english ? Go here VeighNa是一套基于Python的开源量化交易系统开发框架,在开源社区持续不断的贡献下一步步成长为多功能量化交易平台,自发布以来已经积累了众多来自金融机构或相关领域的用户,包括私募基金、证券公司、期货公司等。 在使用VeighNa进行二次开发(策略、模块等)的过程中有任何疑问,请查看VeighNa项目文档,如果无法解决请前往官方社区论坛的【提问求助】板块寻求帮助,也欢迎在【经验分享】板块分享你的使用心得! 想要获取更多关于VeighNa的资讯信息? 请扫描下方二维码添加小助手加入【VeighNa社区交流微信群】: AI-Powered VeighNa发布十周年之际正式推出4.0版本,重磅新增面向AI量化策略的vnpy.alpha模块,为专业量化交易员提供一站式多因子机器学习(ML)策略开发、投研和实盘交易解决方案: :bar_chart: dataset:因子特征工程 * 专为ML算法训练优化设计,支持高效批量特征计算与处理 * 内置丰富的因子特征表达式计算引擎,实现快速一键生成训练数据 * Alpha 158:源于微软Qlib项目的股票市场特征集合,涵盖K线形态、价格趋势、时序波动等多维度量化因子 :bulb: model:预测模型训练 * 提供标准化的ML模型开发模板,大幅简化模型构建与训练流程 * 统一API接口设计,支持无缝切换不同算法进行性能对比测试 * 集成多种主流机器学习算法: * Lass...
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值