LR回忆录

本文回忆并总结了LR算法在广告部门点击率预估中的应用,包括LR建模、L1与L2范数的区别、LR与NB的联系、模型求解方法(如梯度法、牛顿法、BFGS、L-BFGS)以及实战中遇到的经典问题,如正负样本不平衡和训练集与测试集分布差异。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

广告部门点击率预估采用的是LR算法。以前学习算法都局限于理论,这次是实战。回忆总结下 LR,以后备用。

这里结合点击率预估整理下LR算法,为以后实践应用提供参考。

内容包括LR建模L1&L2范数LR和NB联系LR求解以及实践中遇到的一些经典问题


LR建模

一般线性回归模型是y=<w,x>,然后根据观测样本来估计参数w。参数估计采用极大似然估计,在假设误差变量服从均值为0的正态分布前提下,我们熟知的最小二乘法和极大似然估计等价。具体证明见这里

LR是一种广义的线性回归模型,主要是利用了连接函数sigmod函数f(t) = 1 / (1+pow(e, -t)),即我们的模型是:
y = f (<w, x>),也即ln(y/[1-y]) = <w, x>(p/[1-p]称作几率),这里将预测值y做了sigmod变换后,值域变为[0, 1]。


L1(Lass0) vs L2(Ridge)

常用机器学习算法经常要面临一个过拟合的问题,LR也不例外,这时就会考虑利用范数来限制模型复杂度避免过拟合。 常用的有L1和L2范数,L1范数具有特征选择的功能,使得模型变得稀疏简单。关于L0,L1,L2的扯淡,参见这里,L1的稀疏性证明参见这里

LR和NB的联系

LR和NB分别作为Discriminative and Generative Algorithm的代表,虽属不同派系,但在一定假设条件下,却有一定内在联系。从这个联系的推倒过程也可以看到LR模型的可解释性,LR模型求出来的权重实际代表这个特征在正负样本中的均值差异大小。
  • 符号:和预估值的正负相关性
  • 大小:特征的重要程度(均值差异的大小)
  • 常数项含义:即含有普通权重的信息,同时也包含正负样本比信息
关于LR系数的含义这里还有点争论的样子,主要在于特征是否独立,具体见这里



LR模型求解

利用最大似然估计来求解LR模型,最终是求解一个无约束最优化问题。常见无约束最优化问题求解算法有 梯度法,牛顿法,BFGS,L-BFGS:
  • 梯度法:利用梯度信息寻找最速下降方向。利用平面去逼近原函数,一阶收敛。
  • 牛顿法:利用Hessian矩阵寻找下降方向。利用二次曲面去逼近原函数,二阶收敛。
  • BFGS:根据迭代的最近k步信息(函数值,梯度信息)来构造Hessian矩阵的逆。
  • L-BFGS:BFGS的空间复杂度是o(n^2),此算法将空间复杂度降为o(n*k)

最优化之路 梳理了各种最优化算法。

常见经典问题

  • 正负样本悬殊
  • covariate shift(训练集和测试集分布不同)



内容概要:《2024年中国城市低空经济发展指数报告》由36氪研究院发布,指出低空经济作为新质生产力的代表,已成为中国经济新的增长点。报告从发展环境、资金投入、创新能力、基础支撑和发展成效五个维度构建了综合指数评价体系,评估了全国重点城市的低空经济发展状况。北京和深圳在总指数中名列前茅,分别以91.26和84.53的得分领先,展现出大的资金投入、创新能力和基础支撑。低空经济主要涉及无人机、eVTOL(电动垂直起降飞行器)和直升机等产品,广泛应用于农业、物流、交通、应急救援等领域。政策支持、市场需求和技术进步共同推动了低空经济的快速发展,预计到2026年市场规模将突破万亿元。 适用人群:对低空经济发展感兴趣的政策制定者、投资者、企业和研究人员。 使用场景及目标:①了解低空经济的定义、分类和发展驱动力;②掌握低空经济的主要应用场景和市场规模预测;③评估各城市在低空经济发展中的表现和潜力;④为政策制定、投资决策和企业发展提供参考依据。 其他说明:报告调了政策监管、产业生态建设和区域融合错位的重要性,提出了加法律法规建设、人才储备和基础设施建设等建议。低空经济正加速向网络化、智能化、规模化和集聚化方向发展,各地应找准自身比较优势,实现差异化发展。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值