Hi,大家好,我是半亩花海。接着上次的对数似然函数继续更新《白话机器学习的数学》这本书的学习笔记,在此分享线性不可分这一分类算法原理。本章的分类算法原理基于《基于图像大小进行分类》项目,欢迎大家交流学习!
目录
一、线性不可分概述
线性不可分问题(Linear Non-separable Problem)是指在多类别分类问题中,数据样本在特征空间中不能完全线性分离的情况。这种情况通常发生在数据样本在特征空间中存在非线性关系或者数据分布不均匀等情况下。
二、案例分析
在前面的学习中,我们研究了线性可分的情况,现在我们将逻辑回归应用于线性不可分问题,通俗地说,就是用直线不能分类的问题。形象地看,如下这样的情况就是线性不可分。
但是对于这个例子来说,虽然用直线不能分类,但用曲线貌似可以分类。我们应该要像学习多项式回归时那样,去增加次数。
那么,我们就向训练数据中加入 ,考虑下面这样的数据。
通过矩阵乘法的规则,得出 的结果如下。
假设 是下面这样的向量,那么
的图形会是怎样?
由于 ,我们可以先代入,再像之前一样对得到的不等式进行变形。
移项后最终得到的表达式是 ,我们可以试着将此不等式画成图像如下。
之前的决策边界是直线,现在则是曲线了。参数 是随便定的,所以数据完全没有被正确地分类。之后通过随意地增加次数,就可以得到复杂形状的决策边界了。 比如在
之外再增加一个
,就会有圆形的决策边界。在逻辑回归的参数更新中也可以使用随机梯度下降法。
以上思想便是将逻辑回归应用于线性不可分问题的方法。
还有一个名为 SVM(支持向量机)的分类算法也很有名。此外,还有多分类的做法,之后有机会会带大家一起学习交流!