人工神经网络的第一次寒冬
1. 回顾
在1957年,Rosenblatt提出了感知器算法,尽管前面一讲中,我们讲到了感知器算法有那么多的历史意义,但是在当时并没有引起轰动。虽然大家觉得将神经元数学模型引入到机器学习领域的尝试是非常新颖的,但是这个算法没有实际的应用。
2. 感知器算法的局限性及证明
以我们今天的观点来看,问题出在感知器算法只能解决线性可分数据集的分类,对于线性不可分的数据集感知器算法无能为力,但现实生活中大多数分类问题却都是线性不可分的。第一次明确说出上述这些话的人是Marvin Minsky,他是人工智能的先驱之一。在1969年,Marvin Minsky写了一本书《感知器》(Perceptrons),在书中,他明确的定义了线性可分与非线性可分的概念,并指出感知器只能处理线性可分问题,同时,他用大量实际的例子论证了生活中很多分类问题是线性不可分的。

下面我们看其中的一个例子,Minsky指出,识别一幅二值图像是不是连通图,这个问题是线性不可分的问题。
什么是连通图呢?它的意思是图中任意两个黑色的点都能找到一组黑色的点将他们连起来。例如下面的图2,图一、图二是连通图,图三、图四是非连通图。Minsky用数学严格地证明了识别一幅二值图像是不是连通图,是一个线性不可分的问题。

2.1 计算机中图像的存储形式
在讲述这个证明之前,我们需要先了解一下图像在计算机中的存储。在计算机中,图像是以矩阵的形式存储的。下图3(a)是一幅 512 × 512 512×512 512×512的灰度图像,即这幅图像长有 512 512 512个像素,宽也有 512 512 512个像素,这些像素的点规则均匀的排布在图 3 ( b ) 512 × 512 3(b)512×512 3(b)512×512的矩阵中,而矩阵中的每一个数是像素值,这幅图是 8 b i t 8bit 8bit的灰度图。在这幅图中,像素值是 0 − 255 0-255 0−255的整数,其中 0 0 0代表纯黑色, 255 255 255代表纯白色,而中间值代表各种不同的灰度。如果是彩色图,那么将会得到三个矩阵,每个矩阵分别代表红色 ( R ) (R) (R)、绿色 ( G ) (G) (G)、蓝色 ( B ) (B) (B)三个颜色分量,而这三种分量的值也是在 0 − 255 0-255 0−255之间。




我们这里提到二值图是指每个像素要么是白色,要么是黑色。我们用 0 0 0代表白色, 1 1 1代表黑色,那么二值图也可以表示为一个值为 0 0 0或 1 1

本文回顾了1957年的感知器算法及其局限性,重点讨论了Marvin Minsky如何在1969年的《感知器》一书中证明了识别连通图是非线性可分问题,导致了人工神经网络研究的第一次寒冬。内容包括计算机中图像的存储形式和连通图非线性可分的数学证明。
最低0.47元/天 解锁文章
19





