机器学习 | 分类算法原理——线性不可分

Hi,大家好,我是半亩花海。接着上次的对数似然函数继续更新《白话机器学习的数学》这本书的学习笔记,在此分享线性不可分这一分类算法原理。本章的分类算法原理基于《基于图像大小进行分类》项目,欢迎大家交流学习!

目录

一、线性不可分概述

二、案例分析


一、线性不可分概述

线性不可分问题(Linear Non-separable Problem)是指在多类别分类问题中,数据样本在特征空间中不能完全线性分离的情况。这种情况通常发生在数据样本在特征空间中存在非线性关系或者数据分布不均匀等情况下。


二、案例分析

在前面的学习中,我们研究了线性可分的情况,现在我们将逻辑回归应用于线性不可分问题,通俗地说,就是用直线不能分类的问题。形象地看,如下这样的情况就是线性不可分。

但是对于这个例子来说,虽然用直线不能分类,但用曲线貌似可以分类。我们应该要像学习多项式回归时那样,去增加次数。

那么,我们就向训练数据中加入 x_1^2,考虑下面这样的数据

\boldsymbol{\theta}=\left[\begin{array}{c} \theta_0 \\ \theta_1 \\ \theta_2 \\ \theta_3 \end{array}\right], \quad \boldsymbol{x}=\left[\begin{array}{c} 1 \\ x_1 \\ x_2 \\ x_1^2 \end{array}\right]

通过矩阵乘法的规则,得出 \boldsymbol{\theta}^{\mathrm{T}} \boldsymbol{x} 的结果如下。

\boldsymbol{\theta}^{\mathrm{T}} \boldsymbol{x}=\theta_0+\theta_1 x_1+\theta_2 x_2+\theta_3 x_1^2

假设 \theta下面这样的向量,那么 \boldsymbol{\theta}^{\mathrm{T}} \boldsymbol{x} \geq 0图形会是怎样?

\boldsymbol{\theta}=\left[\begin{array}{l} \theta_0 \\ \theta_1 \\ \theta_2 \\ \theta_3 \end{array}\right]=\left[\begin{array}{c} 0 \\ 0 \\ 1 \\ -1 \end{array}\right]

由于 \boldsymbol{\theta}^{\mathrm{T}} \boldsymbol{x} \geq 0,我们可以先代入,再像之前一样对得到的不等式进行变形

\begin{aligned} \boldsymbol{\theta}^{\mathrm{T}} \boldsymbol{x} & =\theta_0+\theta_1 x_1+\theta_2 x_2+\theta_3 x_1^2 \\ & =0+0 \cdot x_1+1 \cdot x_2+-1 \cdot x_1^2 \\ & =x_2-x_1^2 \geqslant 0 \end{aligned}

移项后最终得到的表达式是 x_2 \geqslant x_1^2,我们可以试着将此不等式画成图像如下。

之前的决策边界是直线,现在则是曲线了。参数 \theta 是随便定的,所以数据完全没有被正确地分类。之后通过随意地增加次数,就可以得到复杂形状的决策边界了。 比如在 x_1^2 之外再增加一个 x_2^2,就会有圆形的决策边界。在逻辑回归的参数更新中也可以使用随机梯度下降法。

以上思想便是将逻辑回归应用于线性不可分问题的方法。

还有一个名为 SVM(支持向量机)的分类算法也很有名。此外,还有多分类的做法,之后有机会会带大家一起学习交流!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

半亩花海

你的鼓励将是我创作的最大动力!

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值