机器学习小组知识点39:广义线性模型(Generalized Linear Model)

本文介绍了逻辑回归在美团的实际应用,包括模型、决策函数、参数求解、正则化等方面,并展示了如何利用逻辑回归预测用户购买偏好,通过Spark版LR算法提高下单率,以及在推荐系统中的作用。逻辑回归因其简单高效,常作为分类问题的基础模型。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

声明:
本文内容主要转自http://tech.meituan.com/intro_to_logistic_regression.html
本人只是将其根据自己理解二次开发供学习交流,对原作者表示感谢,维护知识产权,人人有责!

逻辑回归(Logistic Regression)是机器学习中的一种分类模型,由于算法的简单和高效,在实际中应用非常广泛。本文作为美团机器学习InAction系列中的一篇,主要关注逻辑回归算法的数学模型和参数求解方法,最后也会简单讨论下逻辑回归和贝叶斯分类的关系,以及在多分类问题上的推广。

逻辑回归


实际工作中,我们可能会遇到如下问题:

  • 预测一个用户 点击特定的商品
  • 判断用户的性别
  • 预测用户 会购买给定的品类
  • 判断一条评论是正面的还是负面的

这些都可以看做是分类问题,更准确地,都可以看做是二分类问题。同时,这些问题本身对美团也有很重要的价值,能够帮助我们更好的了解我们的用户,服务我们的用户。要解决这些问题,通常会用到一些已有的分类算法,比如逻辑回归,或者支持向量机。它们都属于有监督的学习,因此在使用这些算法之前,必须要先收集一批标注好的数据作为训练集。有些标注可以从log中拿到(用户的点击,购买),有些可以从用户填写的信息中获得(性别),也有一些可能需要人工标注(评论情感极性)。另一方面,知道了一个用户或者一条评论的标签后,我们还需要知道用什么样的特征去描述我们的数据,对用户来说,可以从用户的浏览记录和购买记录中获取相应的统计特征,而对于评论来说,最直接的则是文本特征。这样拿到数据的特征和标签后,就得到一组训练数据:

D=(x1,y1),(x2,y2)(xN,yN)
其中 xi 是一个 m 维的向量, xi=[xi1,xi2,,xim] , y 在 {0, 1} 中取值。(本文用{1,0}表示正例和负例,后文沿

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值