机器学习数学原理(2)——广义线性模型

本文深入探讨了机器学习中的广义线性模型(GLMs),包括指数族分布的概念,如伯努利和正态分布,并详细解释了如何构建GLMs。文章通过Logistic和Softmax回归实例,阐述了如何利用指数族分布假设来建立预测函数,并介绍了模型参数的调整方法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

机器学习数学原理(2)——广义线性模型

这篇博文主要介绍的是在机器学习中的回归问题以及分类问题中的一个非常具有概括性的模型:广义线性模型(Generalized Linear Models,简称GLMs),这类模型包括了回归问题中的正态分布,也包含了分类问题中的伯努利分布。随着我们的分析我们会发现,广义线性模型不仅可以导出Logistics回归,也可以导出Softmax回归。

1.指数族

在导出模型之前,先得介绍一下指数族(The exponential family)

1.1 指数族定义

先给出指数族分布的定义式:

  • η:自然参数(natural parameter)
  • T(η):充分统计量(sufficient statistic)
  • a(η):对数配分函数(log partition function)
  • b(η):系数函数

由这个形式我们可以看出,只要我们确定了T,a,b函数的具体形式,分布就变成了一个由η参数化确定的分布。很多我们常见的分布,比如伯努利分布、正态分布都可以写成指数族的形式,下面笔者便写写如何将这些分布转化为指数分布的形式。

1.2 常见指数族

由上述的分析我们可以知道,要想把分布写成指数族的形式就需要确定分布的T,a,b函数。

1.2.1 伯努利分布

伯努利分布是一个二值分布,y只能取1或者0。伯努利分布可以写成如下形式:

p(y=1;φ)=φ

p(y=0;φ)=1-φ

将这个式子更加简练的书写便成了下面的形式

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值