第三弹、AI、LLM大模型是什么？

原创已于 2025-08-31 20:28:31 修改 · 448 阅读

·

5

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

于 2025-08-30 20:09:06 首次发布

AI大模型专栏收录该内容

5 篇文章

订阅专栏

1.什么是AI？

2.chagpt是AI吗？

3.什么是生成式AI？

一、什么是AI？

1.1 什么是AI？

AI就是人工智能，或者人工智慧。

AI（Artificial Intelligence，人工智能）是通过计算机技术模拟、延伸或扩展人类智能的综合性技术，其核心目标是让机器具备类似人类的感知、学习、推理和决策能力‌。

1.2 chatgpt是AI吗？

chatgpt是AI，只是生成式AI的一个典型例子。

ChatGPT 是一种基于 ‌Transformer 架构‌ 的 ‌生成式预训练语言模型‌（Generative Pre-trained Transformer），由 OpenAI 开发，主要用于自然语言处理任务，如对话生成、文本创作和问答等‌。

二、什么是生成式AI

2.1 什么是生成式AI

AI目标：让机器展现智慧。

生成式AI：机器产生的复杂有结构的物件，包括文章、影像、语音。

复杂到什么程度？：没有办法穷举。

2.2 哪些不是生成式AI问题？

分类：从有限的选项中做选择。

例如：gmail垃圾邮件分类；狗猫侦测器（图片中是猫还是狗）。

2.3 机器学习

机器自动从资料里边找到一个函数。

例如解方程。a,b是参数。

y=f(x)=ax+b

假如输入x=4, 输出y=4

假如输入x=2,输出y=-1

请找出a,b

机器学习是自动找出参数的方法。

2.4 模型

有上万个未知参数的函数叫做模型。

模型是对现实世界问题的数学抽象，通过输入数据（特征）映射到输出（预测结果）‌。

训练training：机器学习把上万个参数找出来的过程，叫做训练，或者学习learning。

训练资料：帮助把上万个参数找出来的资料，叫做训练资料（样本）。

测试testing（推论 inference）：输入参数，通过模型进行代入，得到输出的过程，叫做测试，或者推理。

相当于函数的代入x,y，得到函数的结果。

2.5 深度学习

深度学习是一种机器学习技术。

机器学习是一种手段。

2.5 chatgpt也是一个函数

chatgpt使用Transformer模型

2.6 创造力

机器需要产生在训练时从来没有看过的东西，叫做创造力。

推理过程模拟：

chatgpt推理的核心精神：文字接龙

原本生成一个答案需要无穷尽的枚举，但是在chatgpt中，生成一个答案：拆成一连串的文字接龙。预测下一个文字接龙。

这种支持文字接龙的模型就称为语言模型。

2.7 生成策略:自回归生成

文字生成策略：文字接龙

‌Autoregressive Generation（自回归生成）‌ 是一种序列生成方法，广泛应用于自然语言处理（NLP）、时间序列预测、代码生成等领域。其核心思想是：‌模型基于已生成的序列逐步预测下一个元素‌，每次生成一个 token（如单词、字符或时间步数据），并递归地将其作为输入继续生成后续内容。

其他生成策略：

三、Chatgpt

G:

P:

T:

3.2 为什么同一问题模型输出的结果多样化？

模型推理下一个token采用的是掷骰子的机制。因为每次选择几率最大的话，不一定能够得到最好的结果。

gpt3

微调：督导式学习

3.3 预训练

预训练强化模型学习能力。

3.4 增强式学习

从人类的回馈学习：RLHF

人类觉得好的答案，提高这个答案的几率

对齐：督导式学习+增强式学习

促进语言模型与人类的需求对齐。

参考资料：
2.第1讲：生成式AI是什么_哔哩哔哩_bilibili

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。