人人都能看懂的 ChatGPT 原理课:ChatGPT 是一个语言模型

本文详细介绍了ChatGPT的语言模型,包括语言模型的基础概念、ChatGPT的数学建模,如N-gram、log化处理以及最大似然概率。通过实例解释了如何依赖上下文进行正确的文字输出,展示了ChatGPT如何进行预训练以实现语言交流能力。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

目录

语言模型是什么?

ChatGPT 语言模型的数学建模

1、语言模型基础建模

2、N-gram 语言建模

3、语言模型 log 化

ChatGPT 的语言模型

1、ChatGPT 的建模公式

2、语言模型中的最大似然概率

3、ChatGPT 语言模型的训练方式

总结


从本节开始,我们将详细介绍一下 ChatGPT 的模型结构和训练方式,其中必然会涉及到一些公式和示意图。为了方便读者理解,一方面,我对公式尽量做了缩减,并以举例的形式进行解释;另一方面,我经常以打比方的方式,让大家直观地感受公式所蕴含的原理。当然,如果对于理解公式确实十分头疼,可以重点阅读文字部分,对公式有个定性的认识也是 OK 的。

语言模型是什么?

ChatGPT 是一个语言模型,是属于 NLP 领域的概念。那什么是语言模型呢?我们来举几个例子解释一下。

例1:请各位做一个完形填空:掘金社区是一个______的技术交流平台。

在这个例子里,上述的空格处应该填什么字呢?中文汉字总共有上万个,空格里填任何一个字,都算是完成了这个动作,我们真正关心的,是填什么字才能让文字读起来通顺

有的人觉得毫无疑问应该填“便捷”,而有的人觉得应该是“实用”,

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

人工智能_SYBH

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值