以GPT为代表的大模型,拥有回答问题或者续写文本的能力。它的运行模式,实际上是阅读了大量文本,学习到了一些权重并固化下来,形成了一个函数,这个函数有亿级的参数(权重)。然后匹配用户的输入,去去“猜”下一个词的概率。在大模型里面,学习就是训练,“猜”或“生成”就是推理。这是两个非常重要的词汇。
大模型在做推理时,它并不是匹配文本,而是匹配语义。语义匹配,我觉个例子,比如说你问一句:“怎么过去?”,这个和“乘坐什么交通工具到目的地”是同一个意思。这个和传统搜索引擎用关键字匹配有本质区别。关于语义匹配,以后在embedding模型和rag时,再和大家专门聊聊。
神经网络
要理解大模型的工作模式,就离不开神经网络。其实前面提到的这个拥有众多参数的函数,就是用来计算神经元输出值的一个函数。最终这些用于处理信息的神经元,会经过层层计算,形成一个或一堆结果。
这些结果一般都是一组数字,它用来描述一个句子、一个分类或其他数据。像GPT这类模型,实质上就是一个巨大的神经网络,它采用的是常用于做自然语言处理(NLP)的特殊神经网络架构,也就是Transformer架构。据说GPT4拥有1.8万亿权重,可以简单理解为它是一个拥有1.8万亿参数的大函数。
上图这个神经网络有输入层、中间层、输出层。计算过程从左到右(信息传递方向),即从输入层到中间层,再从中间层到输入层,这里有两次带有权重的计算,所以我们称之为两层神经网络结构。
图中的x1和x2是两个输入,它们分别连接到y1、y2、y3这三个神经元,连接线上标有各自的输入权重。比如wx1y1表示x1到y1的权重,wx2y1就表示x2到y1的权重。
我们先来计算下y的值。
y1=x1*wx1y1+x2*wx2y1
y2=x1*wx1y2+x2*wx2y2
y3=x1*wx1y3+x2*wx2y3
假如我们设x1=0.3、x2=0.5,wx1y1=0.1、wx1y2=0.4、wx1y3=0.7、wx2y1=0.2、wx2y2=0.5、wx2y3=0.9
那么:
y1=0.3*0.1+0.5*0.2=0.13
y2=0.3*0.4+0.5*0.5=0.37
y3=0.3*0.7+0.5*0.9=0.66
在这里,我们终于算出了第一层的结果,假如要算第二层,重复第一层的过程就可以了。不过大家可以想象,假如是更多维更多层的网络神经,手工计算是非常复杂的,我们得找到规律,通过一定的公式进行计算。
矩阵乘积
我们在做运算时,数组是一个好工具,很多算法都是基于数组来实现的。数组可以是一维,也可以是多维。
简单的一维数组就像这样:
arr0=[1,3,5,7,9]
arr1=[2,4,6,8,10]
二维数组就像这样:
arr3=[[1,3,5,7,9],[2,4,6,8,10]]
而在深度学习里面,通常会使用矩阵来解决计算问题,一个二维数组,就可以看成一个矩阵。
以前面的神经网络为例,输入和权重,就可以看成是两个矩阵,y值就是两个矩阵计算后的结果。
inputArr=[x1,x2]
weightArr=[[wx1y1,wx1y2,wx1y3],[wx2y1,wx2y2,wx2y3]]
我们把这两个矩阵画出来,如图所示:
矩阵A和矩阵B的乘法过程是:A的行和B的列加和,最终得到一个新的矩阵,即[y1,y2,y3],这就叫做矩阵乘积。
Python的NumPy库,就很方便做这类矩阵计算,我们可以用代码尝试下。
首先导入numpy:
pip install numpy
然后执行计算:
import numpy as np
x=np.array([0.3,0.5])
y=np.array([[0.1,0.4,0.7],[0.2,0.5,0.9]])
z=np.dot(x,y)
print(z)
输出:
[0.13 0.37 0.66]
numpy的dot就是点集函数,即进行矩阵乘法,最终和我们手工计算是一致的。
AI大模型学习福利
作为一名热心肠的互联网老兵,我决定把宝贵的AI知识分享给大家。 至于能学习到多少就看你的学习毅力和能力了 。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
因篇幅有限,仅展示部分资料,需要点击下方链接即可前往获取
2024最新版优快云大礼包:《AGI大模型学习资源包》免费分享
一、全套AGI大模型学习路线
AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能!
因篇幅有限,仅展示部分资料,需要点击下方链接即可前往获取
2024最新版优快云大礼包:《AGI大模型学习资源包》免费分享
二、640套AI大模型报告合集
这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。
因篇幅有限,仅展示部分资料,需要点击下方链接即可前往获取
2024最新版优快云大礼包:《AGI大模型学习资源包》免费分享
三、AI大模型经典PDF籍
随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。
因篇幅有限,仅展示部分资料,需要点击下方链接即可前往获取
2024最新版优快云大礼包:《AGI大模型学习资源包》免费分享
四、AI大模型商业化落地方案
因篇幅有限,仅展示部分资料,需要点击下方链接即可前往获取
2024最新版优快云大礼包:《AGI大模型学习资源包》免费分享
作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。