逻辑回归的损失函数与损失函数的梯度公式推导

逻辑回归的损失函数

  逻辑回归的函数为
f(x)=11+e−θTxf(x) = \cfrac{1} {1+e^{-\theta^T x }}f(x)=1+eθTx1

  公式满足分布函数的性质
(1)非负有界性 0<=F(x)<=10<= F(x) <=10<=F(x)<=1 (2)单调连续性 (3)右连续性 F(x0+)=F(x)F(x_0^+) = F(x)F(x0+)=F(x)
  所以可以认为是随机变量x的分布函数,即为F(x)=P(x)F(x) = P(x)F(x)=P(x)即为
P(x)=11+e−θTxP(x) = \cfrac{1} {1+e^{-\theta^T x }}P(x)=1+eθTx1 公式1
  假设该分类标签为1时的概率为P,我们可以假设对于一个特定的score,如果大于该score该事件发生;小于或等于该score,该事件不发生。
发生该事件即为变量Y = 1,不发生即为Y = 0,假设Y = 1发生的概率为P,这Y = 0发生的概率为1 - P。
  对于变量Y分布函数可以写成
p(y∣x)=f(x)={ P,  Y=11−P,  Y=0p(y|x) =f(x) = \left\{\begin{matrix} P, \; Y = 1 \\ 1 - P, \; Y = 0 \end{matrix}\right.p(yx)=f(x)={ P,Y=11P,Y=0

  为简化表示可以写成
P(y∣x)=Py(1−P)(y−1)P(y|x) = P^{y} {(1 - P)^{(y-1)}}P(yx)=Py(1P)(y1)
  对于已有的样本数据集X1,X2,...,Xn{X_1,X_2,...,X_n}X1,X2,...,Xn
对于上述样本同时发生的概率可以表示为

P总=P(y1∣x1)P(y1∣x2)P(y1∣x2)...P(yn∣xn)=∏i=1nP(yi∣xi)=∏i=1nPyi(1−P)(yi−1) P_总 = P(y_1|x_1) P(y_1|x_2) P(y_1|x_2)... P(y_n|x_n)\\ = \prod_{i= 1}^{n}P(y_i|x_i)\\ = \prod_{i= 1}^{n}P^{y_i} {(1 - P)^{(y_i-1)}}\\ P

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值