第三弹、AI、LLM大模型是什么?

1.什么是AI?

2.chagpt是AI吗?

3.什么是生成式AI?

一、什么是AI?

1.1 什么是AI?

AI就是人工智能,或者人工智慧。

AI(Artificial Intelligence,人工智能)是通过计算机技术模拟、延伸或扩展人类智能的综合性技术,其核心目标是让机器具备类似人类的感知、学习、推理和决策能力‌。

1.2 chatgpt是AI吗?

chatgpt是AI,只是生成式AI的一个典型例子。

ChatGPT 是一种基于 ‌Transformer 架构‌ 的 ‌生成式预训练语言模型‌(Generative Pre-trained Transformer),由 OpenAI 开发,主要用于自然语言处理任务,如对话生成、文本创作和问答等‌。

二、什么是生成式AI

2.1 什么是生成式AI

AI目标:让机器展现智慧。

生成式AI:机器产生的复杂有结构的物件,包括文章、影像、语音。

复杂到什么程度?:没有办法穷举。

2.2 哪些不是生成式AI问题?

分类:从有限的选项中做选择。

例如:gmail垃圾邮件分类;狗猫侦测器(图片中是猫还是狗)。

2.3 机器学习

机器自动从资料里边找到一个函数。

例如解方程。a,b是参数。

y=f(x)=ax+b

假如输入x=4, 输出y=4

假如输入x=2,输出y=-1

请找出a,b

机器学习是自动找出参数的方法。

2.4 模型

有上万个未知参数的函数叫做模型。

模型是对现实世界问题的数学抽象,通过输入数据(特征)映射到输出(预测结果)‌。

训练training:机器学习把上万个参数找出来的过程,叫做训练,或者学习learning。

训练资料:帮助把上万个参数找出来的资料,叫做训练资料(样本)。

测试testing(推论 inference):输入参数,通过模型进行代入,得到输出的过程,叫做测试,或者推理。

相当于函数的代入x,y,得到函数的结果。

2.5 深度学习

深度学习是一种机器学习技术。

机器学习是一种手段。

2.5 chatgpt也是一个函数

chatgpt使用Transformer模型

2.6 创造力

机器需要产生在训练时从来没有看过的东西,叫做创造力。

推理过程模拟:

chatgpt推理的核心精神:文字接龙

原本生成一个答案需要无穷尽的枚举,但是在chatgpt中,生成一个答案:拆成一连串的文字接龙。预测下一个文字接龙。

这种支持文字接龙的模型就称为语言模型。

2.7 生成策略:自回归生成

文字生成策略:文字接龙

Autoregressive Generation(自回归生成)‌ 是一种序列生成方法,广泛应用于自然语言处理(NLP)、时间序列预测、代码生成等领域。其核心思想是:‌模型基于已生成的序列逐步预测下一个元素‌,每次生成一个 token(如单词、字符或时间步数据),并递归地将其作为输入继续生成后续内容。

其他生成策略:

三、Chatgpt

G:

P:

T:

3.2 为什么同一问题模型输出的结果多样化?

模型推理下一个token采用的是掷骰子的机制。因为每次选择几率最大的话,不一定能够得到最好的结果。

gpt3

微调:督导式学习

3.3 预训练

预训练强化模型学习能力。

3.4 增强式学习

从人类的回馈学习:RLHF

人类觉得好的答案,提高这个答案的几率

对齐:督导式学习+增强式学习

促进语言模型与人类的需求对齐。

参考资料:
2.第1讲:生成式AI是什么_哔哩哔哩_bilibili

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值