机器学习数学原理（2）——广义线性模型

最新推荐文章于 2025-06-11 18:45:11 发布

X_XZhang

最新推荐文章于 2025-06-11 18:45:11 发布

阅读量2.6k

点赞数

CC 4.0 BY-SA版权

分类专栏：机器学习算法文章标签：机器学习数学算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/z_x_1996/article/details/70336279

本文深入探讨了机器学习中的广义线性模型（GLMs），包括指数族分布的概念，如伯努利和正态分布，并详细解释了如何构建GLMs。文章通过Logistic和Softmax回归实例，阐述了如何利用指数族分布假设来建立预测函数，并介绍了模型参数的调整方法。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

机器学习数学原理（2）——广义线性模型

这篇博文主要介绍的是在机器学习中的回归问题以及分类问题中的一个非常具有概括性的模型：广义线性模型（Generalized Linear Models，简称GLMs），这类模型包括了回归问题中的正态分布，也包含了分类问题中的伯努利分布。随着我们的分析我们会发现，广义线性模型不仅可以导出Logistics回归，也可以导出Softmax回归。

1.指数族

在导出模型之前，先得介绍一下指数族（The exponential family）。

1.1 指数族定义

先给出指数族分布的定义式：

η：自然参数（natural parameter）
T(η)：充分统计量（sufficient statistic）
a(η)：对数配分函数（log partition function）
b(η)：系数函数

由这个形式我们可以看出，只要我们确定了T，a，b函数的具体形式，分布就变成了一个由η参数化确定的分布。很多我们常见的分布，比如伯努利分布、正态分布都可以写成指数族的形式，下面笔者便写写如何将这些分布转化为指数分布的形式。

1.2 常见指数族

由上述的分析我们可以知道，要想把分布写成指数族的形式就需要确定分布的T，a，b函数。

1.2.1 伯努利分布

伯努利分布是一个二值分布，y只能取1或者0。伯努利分布可以写成如下形式：

p(y=1;φ)=φ

p(y=0;φ)=1-φ

将这个式子更加简练的书写便成了下面的形式

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。