第1章 逻辑斯蒂回归
逻辑斯蒂回归模型
1.1.1 逻辑斯蒂分布
定义1.1 (逻辑斯蒂分布):设X是连续随机变量,
其中,u为未知参数,
逻辑斯蒂分布的密度函数和分布函数如图6.1所示。分布函数属于逻辑斯蒂函数,其图形是一条S形曲(sigmoid curve)。该曲线以点(
曲线在中心附近增长速度较快,在两端增长速度较慢。形状参数r的值越小,曲线在中心附近增长越快。
1.1.2 二项逻辑斯蒂回归模型
二项逻辑斯蒂回归模型是一种分类模型,由条件概率分布
定义1.2 (逻辑斯蒂回归模型)二项逻辑斯蒂回归模型是如下的条件概率分布:
其中,x∈Rn是输入,Y∈{0,1}是输出,w∈Rn和b∈R是参数,w称为权重,
对于给定输入x,计算
有时为了方便,将权重向量和输入向量加以扩充,即
现在考察逻辑斯蒂回归模型的特点。一个事件的几率(odds)是指该事件发生的概率与该事件不发生的概率的比值。如果事件发生的概率是 p,那么该事件的几率是
对于逻辑斯蒂回归而言,由式(1.5)和式(1.6)得:
也就是说,在逻辑斯蒂回归模型中,输出Y=1的对数几率是输入x的线性函数。
1.3 模型参数估计
逻辑斯蒂回归模型学习时,对于给定的训练集
设:P(Y=1|x)=π(x),P(Y=0|x)=1−π(x)
则似然函数为:∏Ni=1[π(xi)]yi[1−π(xi)]1−yi
对数似然函数为:
对L(w)求极大值,得到w的估计值。
这样,问题就变成以对数似然函数为目标函数的最优化问题。逻辑斯蒂回归学习中通常采用的方法是梯度下降及拟牛顿法。
1、求解方法一:梯度上升法