49、利用逻辑回归进行数据分类

利用逻辑回归进行数据分类

1. 测试不同的逻辑函数

我们尝试使用两个具有不同决策边界的逻辑函数,通过比较成本来确定哪个函数的决策边界更优。这里选取两个例子:一个是我凭经验猜测的决策边界 $p = 0.56 - 0.35 \cdot x$,即 $0.35 \cdot x + 1 \cdot p = 0.56$;另一个是任意选取的 $x + p = 1$。显然,前者在区分普锐斯(Prius)和宝马(BMW)车型上表现更好。

在源代码中,有一个 plot_line 函数,可根据方程 $ax + by = c$ 中的 $a$、$b$、$c$ 值绘制直线。对于上述两个决策边界,对应的 $(a, b, c)$ 值分别为 $(0.35, 1, 0.56)$ 和 $(1, 1, 1)$。我们可以使用以下代码将这两条直线与汽车数据的散点图绘制在一起:

plot_data(scaled_car_data)
plot_line(0.35,1,0.56)
plot_line(1,1,1)

对应的逻辑函数分别为 $\sigma(0.35 \cdot x + p - 0.56)$ 和 $\sigma(x + p - 1)$,我们预期第一个函数相对于数据的成本更低。可以使用 logistic_cost 函数来验证:

>>> logistic_cost(0.35,1,0.56)
130.92490748700456
>>> logisti
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值