Logistic 回归 损失函数推导及参数更新
Logistic 回归属于广义的线性模型,联系函数为sigmoid
函数
广义的线性模型为y=g(wTx+b)y = g(\boldsymbol{w^Tx} + b)y=g(wTx+b),函数g(.)g(.)g(.)起到了将线性回归模型预测值和真实标记联系起来的作用,称为“联系函数”(link function)。使得g−1(y)g^{-1}(y)g−1(y)与wTx+b\boldsymbol{w^Tx}+bwTx+b形成线性关系。
模型:
z=wTx+by=11+e−z z = \boldsymbol{w^Tx}+b\\ y = \frac{1}{1+e^{-z}} z=wTx+by=1+e−z1
损失函数推导:
采用极大似然估计来推导损失函数。
先写出正负样本的概率预测值:
p(y∗=1∣x;w,b)=yp(y∗=0∣x;w,b)=1−y \begin{aligned} p(y^*=1|\boldsymbol{x};\boldsymbol{w}, b) &= y\\ p(y^*=0|\boldsymbol{x};\boldsymbol{w}, b) &= 1-y\\ \end{aligned} p(y∗=1∣x;w,b)p(y∗=0∣x;w,b)=y=1−y
统一两个式子得到:
p(y∗∣x;w,b)=yy∗(1−y)1−y∗ p(y^*|\boldsymbol{x};\boldsymbol{w}, b) = y^{y^*}(1-y)^{1-y^*} p(y∗∣x;w,b)=yy∗(1−y)1−y∗
假设样本独立且同分布,要让对每个样本的概率值更接近其所属分类,列出极大似然函数:
L(w;b)=∏i=1mp(yi∗∣xi,w,b)=∏i=1myiyi∗(1−yi)1−yi∗ L(\boldsymbol{w};b) = \prod_{i=1}^{m}p(y_i^*|\boldsymbol{x_i}, \boldsymbol{w}, b) = \prod_{i=1}^{m}y_i^{y_i^*}(1-y_i)^{1-y_i^*} L(w;b)=i=1∏mp(yi∗∣xi,w,b)=i=1∏myiy<