李宏毅深度学习笔记(六)逻辑回归

设置函数

我们可以找到一个函数 P w , b ( C 1 ∣ x ) P_{w,b}(C_1|x) Pw,b(C1x),如果 P w , b ( C 1 ∣ x ) ≥ 0.5 P_{w,b}(C_1|x)\ge0.5 Pw,b(C1x)0.5则输出 C 1 C_1 C1,否则输出 C 2 C_2 C2
逻辑回归的模型如下:
P w , b ( C 1 ∣ x ) = σ ( z ) P_{w,b}(C_1|x)=\sigma(z) Pw,b(C1x)=σ(z)

z = w x + b = ∑ i = 1 n w i x i + b z=wx+b=\sum_{i=1}^nw_ix_i+b z=wx+b=i=1nwixi+b

σ ( z ) = 1 1 + e x p ( − z ) \sigma(z)=\frac{1}{1+exp(-z)} σ(z)=1+exp(z)1
在这里插入图片描述
所以我们设置函数为:
在这里插入图片描述

判断函数的好坏

假设我们有下面的一组数据:
在这里插入图片描述
我们假定数据是依据函数 f w , b ( x ) = P w , b ( C 1 ∣ x ) f_{w,b}(x)=P_{w,b}(C_1|x) fw,b(x)=Pw,b(C1x)生成的,那么接下来我们就要求取参数 w w w b b b了。
我们定义:
在这里插入图片描述
最有可能让训练集呈现上面的样子的是使 L ( w , b ) L(w,b) L(w,b)最大的 w ∗ w^* w b ∗ b^* b,即:
在这里插入图片描述
为了简化计算,我们对上式进行一下转换:
在这里插入图片描述
这时候原本的乘法就变成了加法:
在这里插入图片描述
又(这里用到了交叉熵.),我们定义 − l n L ( w , b ) -lnL(w,b) lnL(w,b)为交叉熵损失函数
在这里插入图片描述在这里插入图片描述

找一个最好的函数

交叉熵损失函数对 w i w_i wi求偏导(这里用到了求导的链式法则)
在这里插入图片描述
进行化简得:
在这里插入图片描述

逻辑回归和线性回归的对比

在这里插入图片描述

为什么逻辑回归不用平方损失函数

如果我们在逻辑回归中用了平方损失函数的话:
在这里插入图片描述
我们可以看到,如果目标值 y ^ n = 1 \hat y^n=1 y^n=1,当 f w , b ( x n ) = 1 f_{w,b}(x^n)=1 fw,b(xn)=1时,偏导数为0,也就是说因为我们计算出来的值跟目标值是一样的所以不需要更新,这是正确的。但当 f w , b ( x n ) = 0 f_{w,b}(x^n)=0 fw,b(xn)=0的时候,平方损失函数的偏导数为0,也就是说不需要更新,但事实上我们的计算值离实际值很远。
同样的情况会出现在 y ^ n = 0 \hat y^n=0 y^n=0中。
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

comli_cn

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值