神经网络入门:从感知机到现代网络
1. 神经网络基础概述
在人工智能领域,我们常听到“神经网络”这个术语,准确来说应是“人工神经网络(ANN)”,因为目前还没人能复制出真正的大脑,而神经网络的概念正源于此。
神经网络能处理复杂数据,它允许多个输入流经多层处理,产生大量输出,而简单的感知机只能在两个输出中做选择。不过,神经网络也存在过拟合等处理误差问题,需要我们去解决。
2. 神奇的感知机
2.1 感知机的功能理解
1957 年,康奈尔航空实验室的心理学家 Frank Rosenblatt 在美国海军研究局的赞助下发明了感知机。他的设想是创造一台能像人类一样通过试错学习的计算机。最初,感知机不仅是软件,还运行在专用硬件上,能比当时其他计算机更快、更精确地识别复杂图像。Rosenblatt 曾宣称感知机是新型计算机的雏形,能行走、交谈、观察、书写,甚至自我复制和感知自身存在,但后来感知机未能达到他的期望,其能力有限,引发了第一次人工智能寒冬,连接主义也一度被搁置。
感知机是一种迭代算法,它通过不断近似来确定向量 $w$(系数向量)的最佳值。当获得合适的系数向量后,就能预测一个示例是否属于某一类。例如,它最初的任务之一是判断视觉传感器接收到的图像是否像船。其计算公式为:
$y = sign(Xw + b)$
其中,$X$ 是特征矩阵,包含示例的数值信息;$w$ 是系数向量;$b$ 是偏置。当括号内的值等于或大于 0 时,$sign$ 函数输出 1,表示示例属于该类;否则输出 0。
这个算法包含了深度神经网络的所有特征元素:
- 输入的数值处理
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



