建议首先看cs229讲的广义线性模型、exponential family(指数分布族)
对数线性模型包括逻辑回归、最大熵模型和条件随机场等
1、模型
条件概率分布(对数线性模型、概率模型)、判别模型
逻辑回归:
概率分布可由广义线性模型推导得到
多分类时,分子部分为:第k类exp(-wk*x+b),第一类为1
分母部分为所有类分子之和,即标准化因子
最大熵模型:
概率分布由最大熵原理进行建模
分子部分为:exp(特征函数的加权和)
分母部分为对分子的标准化因子
条件随机场:
概率分布由线性链(简单情况)条件随机场确定
分子为:
分母为:
2、策略
最大似然估计
注:凡是已知条件概率分布(其实是似然)的模型,一般策略都是最大似然估计,即最小化对数损失函数
最大似然估计是一种参数估计方法,其他还有最大后验概率(考虑先验的最大似然)、贝叶斯估计(最大后验的基础上进一步增强,分母看做归一化因子,即对分子的积分)最小二乘估计(最小平方估计,最小化误差的平方)等,会在后面总结一节
3、算法
对数线性模型参数估计用到的算法即是最大似然估计用的算法,也就是梯度下降法等
注:条件随机场其他两个问题中,概率用前向-后向算法,预测用维特比算法(同隐马尔科夫模型)
4、补充
最大熵模型
机器学习篇——对数线性模型
最新推荐文章于 2024-10-15 23:11:46 发布

本文探讨了对数线性模型,包括逻辑回归、最大熵模型和条件随机场。介绍了这些模型的概率分布、分类策略如最大似然估计,并提到了参数估计常用的梯度下降法。同时,概述了最大熵模型的推导过程,强调了在条件随机场中的前向-后向算法和维特比算法的应用。
最低0.47元/天 解锁文章
1万+

被折叠的 条评论
为什么被折叠?



