ChatGPT原理简介

最新推荐文章于 2025-06-03 10:06:45 发布

原创

最新推荐文章于 2025-06-03 10:06:45 发布 · 3.1w 阅读

·

66

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#chatgpt #人工智能 #机器学习

文章讲述了GPT3作为生成式模型的特性，如Zero-shot、One-shot和Few-shot学习模式，并指出其可能存在的问题。ChatGPT的出现是为了解决GPT3的局限性，通过有监督学习和强化学习进行优化，提高模型的对话理解和任务执行能力。强化学习在这里用于调整模型输出，使其更符合人类期望，而奖励模型则用来评估输出的质量。此外，文章还讨论了模型的泛化能力和不同训练策略的效果。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

承接上文GPT前2代版本简介

GPT3的基本思想

GPT2没有引起多大轰动，真正改变NLP格局的是第三代版本。

GPT3训练的数据包罗万象，上通天文下知地理，所以它会胡说八道,会说的贼离谱，比如让你穿越到唐代跟李白对诗，不在一个频道上，他说的你理解不了，你说的他理解不了。

GPT3太泛了，把世界上所有的东西都给训练了，不受约束条件的、无法无天，给它发一个指令，它抗拒指令，按照自己的思维模式去做，比如我问一个问题，接下来你用python代码的方式来回答我，它可能不按照这个模式来，不受我的约束。

这就是GPT3，不按照我们自己的思维去做我们自己的事情，也是给后面的ChatGPT做了一个铺垫。

GPT3 三种模式对比

Zero-shot

不管我输入什么，后面都会加上提示，比如把英文转换成法语，接下来就输出了法语。

One-shot

为了让它更好的理解我说的意思，我给它举了一个例子。

举一个例子，这个例子作为输入，我让你干什么，我给你举一个例子，你回答的时候可以参考这个例子。

这些例子都是我写到输入对话框中，一起给到模型，模型基于我写的例子，再往下输出。

Few-shot

Few-shot是举多个例子。

这就是GPT3的基本思想。

Few-shot像在下游任务中又做了个简单的训练，比如举了三个例子，即三条数据，相当于把下游任务融入到了这个任务当中。

GPT3本质上还是一个生成式模型，它不需要下游任务，下游任务可以放到Few-shot或放到One-shot中。

横轴表示语言模型的大小， One-shot和Few-shot之间还是存在差异的，尤其是模型越大的时候，差异越明显，Few-shot效果更好一些。

GPT3网络结构没有什么亮眼的，就是把Transformer做的更大了。

NLP哪家强，就看谁的模型更大，谁的数据更多。

OpenAI训练的GPT-3 1750亿个权重参数，每批次的训练数据大小是3.2M，这么大的量级，目前只有OpenAI大型GPU集群才能玩的转。<

最低0.47元/天解锁文章

200万优质内容无限畅学

平凡人笔记

博客等级

码龄11年

352
原创

141
点赞

767
收藏

164
粉丝

关注

私信

热门文章

分类专栏

平凡人笔记 149篇

上一篇：: GPT前2代版本简介

下一篇：: 网络通信IO模型上

最新评论

基于 TrueLicense 的项目证书验证
陌殇殇陌: 哥，如果我反编译知道你的公钥，用你这份文件随便整哥私钥和生成证书，是不是就把你破解了
扩展RocketMQ 使其支持任意时间精度的消息延迟
施梓航: 整体思路符合预期，可以实现代码再改造下就好了！！
JVM级别内存屏障如何禁止指令重排序的
ewq3721: 关于volatile禁止指令重排序的规则，我发现了一些和规则不同的地方，不知道是不是哪里出问题了，您能不能帮我看看？？禁止指令重排序的规则有一条：普通读写，后面跟volatile写，则禁止重排序。但做了实验，发现有问题。以下是一段经典代码，我对x,y做了volatile修饰，按道理说，x,y输出结果应该没有（0,0），但无论多少次，都有（0,0）的结果。 Thread thread1 = new Thread(new Runnable() { @Override public void run() { a = 1; x = b; } }); Thread thread2 = new Thread(new Runnable() { @Override public void run() { b = 1; y = a; } });
网络通信IO模型-BIO
优快云-Ada助手: 恭喜你，获得了 2023 博客之星评选的入围资格，请看这个帖子（https://bbs.youkuaiyun.com/topics/616445570?utm_source=blogger_star_comment）。请在这里提供反馈： https://blogdev.blog.youkuaiyun.com/article/details/129986459?utm_source=blogger_star_comment。
ChatGPT原理简介
Lion 莱恩呀: 文章写得很好，初来乍到，希望多多关注。期待更多文章！

最新文章

目录

展开全部

收起

评论 13

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。