线性可分数据集
正如我们在机器学习教程的前一章中所展示的,仅由一个感知器组成的神经网络足以分离我们的示例类。当然,我们精心设计了这些类以使其工作。有许多类集群,对于它们不起作用。我们将查看其他一些示例,并将讨论无法分离类的情况。
我们的类是线性可分的。线性可分性在欧几里得几何中有意义。两组点(或类)称为线性可分的,如果平面中至少存在一条直线,使得一类的所有点都在直线的一侧,而另一类的所有点都在另一侧边。
更正式的:
如果两个数据簇(类)可以通过线性方程形式的决策边界分开
∑一世=1nX一世⋅瓦一世=0
它们被称为线性可分。
否则,即如果这样的决策边界不存在,则这两个类被称为线性不可分。在这种情况下,我们不能使用简单的神经网络。
AND 函数的感知器 在我们的下一个示例中,我们将用 Python 编写一个神经网络,它实现逻辑“与”函数。它按以下方式为两个输入定义:
我们在上一章中了解到,具有一个感知器和两个输入值的神经网络可以解释为决策边界,即划分两个类别的直线。我们要在示例中分类的两个类如下所示:
将 matplotlib.pyplot 导入为 plt 将 numpy 导入为 np
图, ax = plt 。子图() xmin , xmax = - 0.2 , 1.4 X = np 。arange ( xmin , xmax , 0.1 ) ax 。scatter ( 0 , 0 , color = "r" ) ax 。scatter ( 0 , 1 , color = "r" ) ax 。分散(1 , 0 , color = "r" ) ax 。scatter ( 1 , 1 , color = "g" ) ax 。set_xlim ([ xmin , xmax ]) ax 。set_ylim ([ - 0.1 , 1.1 ]) m = - 1 #ax.plot(X, m * X + 1.2, label="decision boundary") plt . 情节()
输出:
我们还发现,这样一个原始的神经网络只能创建穿过原点的直线。所以分割线是这样的:
将 matplotlib.pyplot 导入为 plt 将 numpy 导入为 np
图, ax = plt 。子图() xmin , xmax = - 0.2 , 1.4 X = np 。arange ( xmin , xmax , 0.1 ) ax 。set_xlim ([ xmin , xmax ]) ax 。set_ylim ([ - 0.1 , 1.1 ]) m = - 1 for m in np 。范围(0 , 6 , 0.1 ): ax 。绘图( X , m * X ) ax 。scatter ( 0 , 0 , color = "r" ) ax 。scatter ( 0 , 1 , color = "r" ) ax 。scatter ( 1 , 0 , color = "r" ) ax 。分散( 1, 1 , color = "g" ) plt . 情节()
输出:
我们可以看到,这些直线都不能用作决策边界,也不能用作穿过原点的任何其他直线。
我们需要一条线
是=米⋅X+C其中截距c
不等于 0。
例如线
是=-X+1.2
可以用作我们问题的分隔线:
将 matplotlib.pyplot 导入为 plt 将 numpy 导入为 np
图, ax = plt 。子图() xmin , xmax = - 0.2 , 1.4 X = np 。arange ( xmin , xmax , 0.1 ) ax 。scatter ( 0 , 0 , color = "r" ) ax 。scatter ( 0 , 1 , color = "r" ) ax 。分散(1 , 0 , color = "r" ) ax 。scatter ( 1 , 1 , color = "g" ) ax 。set_xlim ([ xmin , xmax ]) ax 。set_ylim ([ - 0.1 , 1.1 ]) m , c = - 1 , 1.2 ax 。绘图( X , m * X + c ) PLT 。情节()
输出
现在的问题是,我们能否找