FTRL算法

最新推荐文章于 2024-03-22 20:19:59 发布

静_流

最新推荐文章于 2024-03-22 20:19:59 发布

阅读量6.8k

点赞数 3

CC 4.0 BY-SA版权

分类专栏：【算法】个性化推荐

本文链接：https://blog.youkuaiyun.com/hiwallace/article/details/81237089

FTRL（Follow-the-regularized-Leader）是一种在线学习算法，常用于点击率预估等场景，以解决模型的稀疏性和效率问题。它结合了L1正则化，保证了模型的稀疏性，并在工程实现上进行了优化，如L1范式策略减少内存使用。FTRL与OGD、FOBOS等在线梯度下降算法相比，通过历史梯度和正则化保持精度和稀疏性。在实际应用中，FTRL还涉及浮点数重新编码、训练数据采样等优化策略。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

概述

GBDT算法是业界比较好用筛选特征的算法，在线学习考虑效率和数据量，经常用GBDT离线筛选特征，输入到在线模型进行实时训练，如今比较好用的方法是GBDT+LR，而FTRL是另外一种很高效的算法，与其类似的有OGD，FOBOS，RDA等，下面将逐一介绍原理以及应用的案例。

线上模型

点击率预估（CTR）问题是计算广告中非常重要的模块，通过预估用户对广告的点击概率来对广告进行排序，进而提升广告效果和收益效率。对于大规模的在线预测模型，不仅要考虑大的数据量带来的处理效率的问题，还要考虑数据的稀疏性对于模型拟合带来的影响。
经典的LR模型主要通过sigmoid函数，将线性拟合结果转化为概率，通过梯度下降（GD）对最大似然概率（loss函数）的求解最终得到参数的估计值。梯度下降法能够保证精度，要想预防过拟合问题一般会加上正则项，L1相对于L2正则能够产生更系数的参数（why？）