Re45：读论文 GPT-1 Improving Language Understanding by Generative Pre-Training

原创已于 2024-03-15 10:19:29 修改 · 1.6k 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#gpt #transformers #NLP #自然语言处理 #OpenAI #LLM #大规模预训练语言模型

于 2023-09-04 19:39:15 首次发布

人工智能学习笔记专栏收录该内容

277 篇文章

订阅专栏

这篇文章介绍了2018年OpenAI的GPT-1研究，通过无监督预训练语言模型解决有监督数据稀缺的问题，探讨了Transformer的优势以及在NLI、QA、语义相似度和文本分类任务中的实验结果。

诸神缄默不语-个人优快云博文目录
 诸神缄默不语的论文阅读笔记和分类

论文全名：Improving Language Understanding by Generative Pre-Training
论文下载地址：https://www.mikecaptain.com/resources/pdf/GPT-1.pdf

官方博文：Improving language understanding with unsupervised learning

本文是2018年OpenAI的工作，是初代GPT的原始论文。

先用无监督数据预训练语言模型（Transformer decoder），再在有监督数据上微调（加一层prediction head，同时优化语言模型和有监督任务的损失函数）
在这里插入图片描述

文章目录

1. 简介
2. GPT-1
- 1. 无监督预训练语言模型
- 2. 微调
3. 实验

1. 简介

NLU任务包括textual entailment, question answering, semantic similarity assessment, and document classification等子任务，本文测试了NLI、QA、语义相似度和文本分类4个任务。
有监督数据稀少，本文的解决方案是在语言模型上用海量无标签数据上进行generative pre-training，然后再在特定子任务上discriminative fine-tuning。
（算半监督学习）

普遍的使用无监督方法来学习语言学知识的方法，是构建预训练词嵌入来提升NLP任务的效果，这种做法有两个问题：1. 在学习文本表征中使用什么优化目标对迁移最有效，不知道。至今没有绝对优秀的方法。2. 如何利用文本表征最有效，不知道。

2. GPT-1

1. 无监督预训练语言模型

标准语言模型目标，最大化文本的似然：
在这里插入图片描述

（ $k$ 是上下文窗口尺寸，条件概率 $P$ ，神经网络的参数 $\Theta$ ）

本文用多层Transofmer decoder¹（多头自注意力机制+position-wise前馈神经网络生成target token上的输出分布）：
在这里插入图片描述
$U$ 是token， $n$ 是层数， $W_e$ 是token嵌入矩阵， $W_p$ 是position embedding矩阵

Transformer相比LSTM的优势体验在对长文本的处理上

2. 微调

通过输入（每个任务被转变成不同形式的输入，见figure 1）得到表征，喂进线性输出层来预测 $y$ ：
在这里插入图片描述

新的优化目标：
在这里插入图片描述

事实上是将两个优化目标加起来：
在这里插入图片描述

3. 实验

1. 数据集

上游预训练数据：BooksCorpus和1B Word Benchmark
下游微调数据

2. 下游任务指标

NLI任务的实验结果
QA和常识推理的实验结果
语义相似度和文本分类的实验结果

3. 模型分析

层数对微调结果的影响（答案是越多越好）和预训练更新次数对zero-shot表现的影响
（数值是经规范化后得到的）
ablation study

Generating Wikipedia by Summarizing Long Sequences ↩︎

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

诸神缄默不语 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。