chatGPT 背后的技术之 GPT1

祖国翔

已于 2024-04-17 10:54:41 修改

阅读量1.1k

点赞数 21

分类专栏：自然语言处理机器学习文章标签： chatgpt 人工智能自然语言处理 gpt

于 2024-03-15 23:40:15 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_42568832/article/details/136752393

版权

chatGPT 所用的GPT模型，最早的模型是GPT1。

今天，我们来详解GPT1的论文 Improving Language Understanding by Generative Pre-Training

论文可以从下面链接下载：https://cdn.openai.com/research-covers/language-unsupervised/language_understanding_paper.pdf

这是一篇2018年的论文。谁能想到，在2022年大方异彩，震惊世界的GPT 模型，它的第一篇论文，讲的GPT 1模型，在2018年时投稿了好多次，但却没有会议或者期刊接收，如果当年openAI的人放弃了GPT模型，或许人类会错失这次生产力大发展的机会？

这篇论文的题目是，通过生成式预训练提升语言模型的理解能力。

在“生成式预训练”中，“生成式”通常指的是一种模型训练的方法，其中模型被训练来生成类似于输入数据的输出。在自然语言处理领域，生成式模型通常指的是能够生成文本或者语言的模型，例如生成式对话模型或生成式语言模型。在“Improving Language Understanding

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。