神经网络入门:原理、架构与应用
1. 引言
人工神经网络是一种流行的机器学习技术,它模拟了生物有机体的学习机制。人类神经系统中的细胞被称为神经元,神经元通过轴突和树突相互连接,轴突和树突之间的连接区域被称为突触。突触连接的强度会随着外部刺激而改变,这就是生物有机体学习的方式。
在人工神经网络中,也模拟了这种生物机制。人工神经网络包含被称为神经元的计算单元,这些计算单元通过权重相互连接,权重的作用类似于生物有机体中突触连接的强度。每个输入到神经元的值都会乘以一个权重,这个权重会影响该单元计算的函数。
人工神经网络通过将输入神经元的计算值传播到输出神经元,并使用权重作为中间参数来计算输入的函数。学习是通过改变连接神经元的权重来实现的。就像生物有机体的学习需要外部刺激一样,人工神经网络的外部刺激由包含待学习函数的输入 - 输出对示例的训练数据提供。例如,训练数据可能包含图像的像素表示(输入)及其标注的标签(如胡萝卜、香蕉)作为输出。
通过不断调整神经元之间的权重,神经网络计算的函数会随着时间的推移而不断优化,从而提供更准确的预测。这种通过有限的输入 - 输出对训练来准确计算未见过输入的函数的能力被称为模型泛化。所有机器学习模型的主要用途都来自于它们将学习从已见的训练数据推广到未见示例的能力。
虽然将人工神经网络与生物神经网络进行类比常被批评为对人类大脑工作方式的拙劣模仿,但神经科学的原理在设计神经网络架构方面往往很有用。另一种观点认为,神经网络是经典机器学习模型的更高级抽象。实际上,神经网络中最基本的计算单元受到了传统机器学习算法(如最小二乘法回归和逻辑回归)的启发。
超级会员免费看
订阅专栏 解锁全文
3143

被折叠的 条评论
为什么被折叠?



