1.什么是AI?
2.chagpt是AI吗?
3.什么是生成式AI?
一、什么是AI?
1.1 什么是AI?
AI就是人工智能,或者人工智慧。
AI(Artificial Intelligence,人工智能)是通过计算机技术模拟、延伸或扩展人类智能的综合性技术,其核心目标是让机器具备类似人类的感知、学习、推理和决策能力。
1.2 chatgpt是AI吗?
chatgpt是AI,只是生成式AI的一个典型例子。
ChatGPT 是一种基于 Transformer 架构 的 生成式预训练语言模型(Generative Pre-trained Transformer),由 OpenAI 开发,主要用于自然语言处理任务,如对话生成、文本创作和问答等。
二、什么是生成式AI
2.1 什么是生成式AI
AI目标:让机器展现智慧。
生成式AI:机器产生的复杂有结构的物件,包括文章、影像、语音。
复杂到什么程度?:没有办法穷举。
2.2 哪些不是生成式AI问题?
分类:从有限的选项中做选择。
例如:gmail垃圾邮件分类;狗猫侦测器(图片中是猫还是狗)。
2.3 机器学习
机器自动从资料里边找到一个函数。
例如解方程。a,b是参数。
y=f(x)=ax+b
假如输入x=4, 输出y=4
假如输入x=2,输出y=-1
请找出a,b
机器学习是自动找出参数的方法。

2.4 模型
有上万个未知参数的函数叫做模型。
模型是对现实世界问题的数学抽象,通过输入数据(特征)映射到输出(预测结果)。

训练training:机器学习把上万个参数找出来的过程,叫做训练,或者学习learning。
训练资料:帮助把上万个参数找出来的资料,叫做训练资料(样本)。
测试testing(推论 inference):输入参数,通过模型进行代入,得到输出的过程,叫做测试,或者推理。
相当于函数的代入x,y,得到函数的结果。
2.5 深度学习
深度学习是一种机器学习技术。

机器学习是一种手段。

2.5 chatgpt也是一个函数

chatgpt使用Transformer模型

2.6 创造力
机器需要产生在训练时从来没有看过的东西,叫做创造力。
推理过程模拟:
chatgpt推理的核心精神:文字接龙
原本生成一个答案需要无穷尽的枚举,但是在chatgpt中,生成一个答案:拆成一连串的文字接龙。预测下一个文字接龙。

这种支持文字接龙的模型就称为语言模型。

2.7 生成策略:自回归生成
文字生成策略:文字接龙

Autoregressive Generation(自回归生成) 是一种序列生成方法,广泛应用于自然语言处理(NLP)、时间序列预测、代码生成等领域。其核心思想是:模型基于已生成的序列逐步预测下一个元素,每次生成一个 token(如单词、字符或时间步数据),并递归地将其作为输入继续生成后续内容。
其他生成策略:
三、Chatgpt
G:
P:
T:

3.2 为什么同一问题模型输出的结果多样化?
模型推理下一个token采用的是掷骰子的机制。因为每次选择几率最大的话,不一定能够得到最好的结果。



gpt3



微调:督导式学习

3.3 预训练

预训练强化模型学习能力。

3.4 增强式学习

从人类的回馈学习:RLHF

人类觉得好的答案,提高这个答案的几率

对齐:督导式学习+增强式学习
促进语言模型与人类的需求对齐。

5434

被折叠的 条评论
为什么被折叠?



