第2章:神经网络的基石——从感知机到多层感知机 (The Bedrock of Neural Networks)
欢迎来到深度学习的核心腹地。本章我们将从最简单的神经元模型——感知机出发,一步步揭开神经网络的面纱,理解它是如何从“浅层”走向“深度”的。本章的反向传播算法和激活函数是后续所有模型的基础,也是笔试和面试中必考的知识点,请务必牢牢掌握。
2.1 感知机(Perceptron):最简单的线性分类器
想象一下大脑中的一个神经元,它接收来自其他多个神经元的信号,经过处理后,决定自己是否要“兴奋”(激活)并传递信号。感知机就是对这个过程最简单的数学建模。
核心思想: 感知机接收一组二进制输入,通过对输入进行加权求和,将结果与一个阈值比较,最终输出1或0。
数学表达:
给定输入向量 x=(x1,x2,...,xn)x = (x_1, x_2, ..., x_n)x=(x1,x2,...,xn) 和对应的权重向量 w=(w1,w2,...,wn)w = (w_1, w_2, ..., w_n)w=(w1,w2,...,wn),以及一个偏置项 bbb(可以看作是阈值的相反数, b=−thresholdb = -\text{threshold}b=−threshold),感知机的输出 yyy 可以表示为:
y={ 1if ∑i=1nwixi+b>00otherwise y = \begin{cases} 1 & \text{if } \sum_{i=1}^{n} w_i x_i + b > 0 \\ 0 & \text{otherwise} \end{cases} y={ 10if ∑i=1nwixi+b>0otherwise
关键特性与局限性(面试考点):
- 线性分类器: 从公式可以看出,∑wixi+b=0\sum w_i x_i + b = 0∑wix

最低0.47元/天 解锁文章
11万+

被折叠的 条评论
为什么被折叠?



