广义线性模型的公式是
P(y;η)=b(y)exp(ηTT(y)−a(η))
其中 η 是自然参数, η=θTx , T(y) 是充分统计量。 P(y;η) 服从指数分布。
============================================================
推导逻辑回归公式
逻辑回归公式是从伯努利分布来的
P(y;ϕ)=ϕy(1−ϕ)1−y=exp(yln(ϕ1−ϕ)+ln(1−ϕ))
其中, b(y)=1 , ηT=lnϕ1−ϕ , T(y)=y , a(η)=−ln(1−ϕ)
在此,由于 η=θTx=lnϕ1−ϕ ,可以得到 ϕ=11+e−θTx ,也就是sigmoid函数。可以得到
P(y;ϕ)=P(y|x;θ)=(11+e−θTx)y(1−11+e−θTx)y
取似然函数 L(θ)
L(θ)=∏i=1mP(yi|xi;θ)
取似然对数
l(θ)=∑i=1m(yilog11+e−θTxi+(1−yi)(log(1−11+e−θTxi)))
l(θ)
就是逻辑回归的代价函数。
有时喜欢在
l(θ)
前面乘以-
1m
,得到的代价函数是
l(θ)=−1m∑i=1m(yilog11+e−θTxi+(1−yi)(log(1−11+e−θTxi)))
迭代公式是
θjn+1=θjn−a1m∑i=1m(11+e−θTxi−yi)xji
其中 j 是分量编号
=============================似然==========================
对似然函数的理解不足,导致以为理解了,后来因为概念模糊,又回头看。来来回回好几次。这里写下来备忘。
取似然函数
根据似然函数的定义,似然函数是在参数
θ
的条件下(并不把
θ
看作变量),事件
x
发生的概率:记
到推导过程中来,事件是样本
{xi,yi}
,即以
θ
为参数,已知输入
xi
时,输出
yi
的几率。
也许理解仍然被不深刻,待续。。。