机器学习篇——对数线性模型

本文探讨了对数线性模型,包括逻辑回归、最大熵模型和条件随机场。介绍了这些模型的概率分布、分类策略如最大似然估计,并提到了参数估计常用的梯度下降法。同时,概述了最大熵模型的推导过程,强调了在条件随机场中的前向-后向算法和维特比算法的应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

建议首先看cs229讲的广义线性模型、exponential family(指数分布族)
对数线性模型包括逻辑回归、最大熵模型和条件随机场等
1、模型
条件概率分布(对数线性模型、概率模型)、判别模型
对数线性模型公式
逻辑回归:
概率分布可由广义线性模型推导得到
多分类时,分子部分为:第k类exp(-wk*x+b),第一类为1
分母部分为所有类分子之和,即标准化因子
最大熵模型:
概率分布由最大熵原理进行建模
分子部分为:exp(特征函数的加权和)
分母部分为对分子的标准化因子
条件随机场:
概率分布由线性链(简单情况)条件随机场确定
分子为:这里写图片描述
分母为:这里写图片描述
2、策略
最大似然估计
注:凡是已知条件概率分布(其实是似然)的模型,一般策略都是最大似然估计,即最小化对数损失函数
最大似然估计是一种参数估计方法,其他还有最大后验概率(考虑先验的最大似然)、贝叶斯估计(最大后验的基础上进一步增强,分母看做归一化因子,即对分子的积分)最小二乘估计(最小平方估计,最小化误差的平方)等,会在后面总结一节
3、算法
对数线性模型参数估计用到的算法即是最大似然估计用的算法,也就是梯度下降法等
注:条件随机场其他两个问题中,概率用前向-后向算法,预测用维特比算法(同隐马尔科夫模型)
4、补充
最大熵模型

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值