一文了解人工智能神经网络的原理

本文介绍了神经网络的起源,从大脑神经元结构到模拟大脑的尝试,再到感知机模型、多层感知机和引入梯度下降的概念。讨论了早期模型的局限,如线性不可分问题,以及如何通过多层网络结构克服这一问题。此外,还概述了深度学习的发展,特别是卷积神经网络和循环神经网络在处理图像和序列数据上的应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

大脑神经元

人脑可能有1000多亿个神经元,每个神经元都可能在几个方向上互相连接着,这么大量的神经元及连接就形成了一个超级大型的网络。我们就是因为这些网络而存在各种各样的思想和意识。

640?wx_fmt=jpeg


大脑神经元即是脑神经细胞,主要包括细胞体、树突、轴突、突触等。

  • 细胞体,由细胞核、细胞质和细胞膜组成。它是神经元新陈代谢的中心,是接收信息并处理的部件。

  • 树突,是细胞体向外延伸树枝状的纤维体,它是神经元的输入通道,接收来自其他神经元的信息。

  • 轴突,是细胞体向处延伸的最长最粗的一条树枝纤维体,即神经纤维,它是神经元的输出通道。轴突有髓鞘纤维和无髓鞘纤维两种结构形式,两者传递信息的速度不同。轴突末端有许多向外延伸的树枝状纤维体,称为神经末梢,它是神经元信息的输出端。

  • 突触,神经元的神经末梢与另一神经元树突或细胞体的接触处即为突触。每一个神经元都通过突触与其他神经元联系,细胞之间通过突触建立起连接,从而实现信息传递,每个神经元约有103~104个突触。

640?wx_fmt=jpeg


模拟大脑

神经网络就是人们试图对大脑内部运作的模拟形式,在计算机领域,这种模型的起源相当早,可以追溯到20世纪40年代中期,当时计算机其实也刚出现不久。

1943年,麦卡洛克和皮茨发表了论文《神经活动内在概念的逻辑演算》,其中首次提出了表示人脑学习功能的一种数学方法。

640?wx_fmt=jpeg


如上图中x类似轴突,其它神经元的输出,经过突触连接树突,经过树突后输入到细胞体,细胞体执行一定运算后再经过激活函数最后输出到轴突。

这个简单的模型就是机器学习中神经网络的基础模型了,不经让我们惊呼我们的大脑如此的简单,但事实并不是这样,人类对大脑的认识是在太少,可以说几乎还没有什么实质性进展。而用这种模型模拟的大脑,实际上比大脑差太多太多了,如果人类是上帝造的,那上帝肯定不会让你猜透他是怎么造的。

这个阶段虽然大脑的神经元已经被数学建模了,我们也并不知道这个模型是否正确,而且当时也没有明确权重参数的调整方法。

感知机模型

进入到20世纪50年代,一种最简单的人工神经元模型被提出来了。感知机?一听感觉就像是一个实际存在的东西,就像计算机一样,它应该是看得见摸得着的机器吧!的确,20世纪60年代第一个硬件实现出现,当时直接将整个硬件都叫感知机,但后来感知机被改成是算法的名字了,所以它其实是一个算法。

640?wx_fmt=jpeg


感知机以前辈的思想作为基础,基于此提出了一种反馈循环的学习机制,通过计算样本输出结果与正确结果之间的误差来进行权重调整。

大致的流程如下:

  • 通过随机数初始化权重参数。

  • 将一个输入向量传入网络。

  • 根据指定的输入向量和权重值计算网络的输出y',感知机的函数如下所示:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值