人工神经网络—第一次寒冬

本文回顾了1957年的感知器算法及其局限性,重点讨论了Marvin Minsky如何在1969年的《感知器》一书中证明了识别连通图是非线性可分问题,导致了人工神经网络研究的第一次寒冬。内容包括计算机中图像的存储形式和连通图非线性可分的数学证明。

1. 回顾

在1957年,Rosenblatt提出了感知器算法,尽管前面一讲中,我们讲到了感知器算法有那么多的历史意义,但是在当时并没有引起轰动。虽然大家觉得将神经元数学模型引入到机器学习领域的尝试是非常新颖的,但是这个算法没有实际的应用。

2. 感知器算法的局限性及证明

以我们今天的观点来看,问题出在感知器算法只能解决线性可分数据集的分类,对于线性不可分的数据集感知器算法无能为力,但现实生活中大多数分类问题却都是线性不可分的。第一次明确说出上述这些话的人是Marvin Minsky,他是人工智能的先驱之一。在1969年,Marvin Minsky写了一本书《感知器》(Perceptrons),在书中,他明确的定义了线性可分与非线性可分的概念,并指出感知器只能处理线性可分问题,同时,他用大量实际的例子论证了生活中很多分类问题是线性不可分的。

在这里插入图片描述

图1 Marvin Minsky(1927-2016)

下面我们看其中的一个例子,Minsky指出,识别一幅二值图像是不是连通图,这个问题是线性不可分的问题。

什么是连通图呢?它的意思是图中任意两个黑色的点都能找到一组黑色的点将他们连起来。例如下面的图2,图一、图二是连通图,图三、图四是非连通图。Minsky用数学严格地证明了识别一幅二值图像是不是连通图,是一个线性不可分的问题
在这里插入图片描述

图2 二值图像连通图或非连通图

2.1 计算机中图像的存储形式

在讲述这个证明之前,我们需要先了解一下图像在计算机中的存储。在计算机中,图像是以矩阵的形式存储的。下图3(a)是一幅 512 × 512 512×512 512×512的灰度图像,即这幅图像 512 512 512个像素,也有 512 512 512个像素,这些像素的点规则均匀的排布在图 3 ( b ) 512 × 512 3(b)512×512 3(b)512×512的矩阵中,而矩阵中的每一个数是像素值,这幅图是 8 b i t 8bit 8bit的灰度图。在这幅图中,像素值 0 − 255 0-255 0255的整数,其中 0 0 0代表纯黑色, 255 255 255代表纯白色,而中间值代表各种不同的灰度。如果是彩色图,那么将会得到三个矩阵,每个矩阵分别代表红色 ( R ) (R) (R)、绿色 ( G ) (G) (G)、蓝色 ( B ) (B) (B)三个颜色分量,而这三种分量的值也是在 0 − 255 0-255 0255之间。

在这里插入图片描述

图3(a) Lenna灰度图像

在这里插入图片描述

图3(b) Lenna灰度图像在计算机中的矩阵存储形式

在这里插入图片描述

图3(c) Lenna彩色图像

在这里插入图片描述

图3(d) Lenna彩色图像在计算机中的矩阵存储形式

我们这里提到二值图是指每个像素要么是白色,要么是黑色。我们用 0 0 0代表白色, 1 1 1代表黑色,那么二值图也可以表示为一个值为 0 0 0 1 1

评论 1
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值