十五、自回归（AutoRegressive）和自编码（AutoEncoding）语言模型

瑞雪兆我心

已于 2024-03-17 09:21:11 修改

阅读量2.3k

点赞数 18

文章标签：回归语言模型数据挖掘

于 2024-03-16 09:38:06 首次发布

本文链接：https://blog.youkuaiyun.com/contributed_l/article/details/136755688

版权

本文讨论了自回归语言模型（AR）和自编码语言模型（AE）在自然语言处理中的应用，AR适合生成类任务但单向，AE具有更强的泛化性和无监督学习能力，但对生成式问题支持有限。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

参考自回归语言模型（AR）和自编码语言模型（AE）

1 自回归语言模型（ AR）

自回归语言模型（AR）就是根据上文内容（或下文内容）预测下一个（或前一个）可能跟随的单词，就是常说的自左向右（或自右向左）的语言模型任务，即通过前 t - 1（或后 t - 1 ）个 tokens 来预测当前时刻 t 的 token，代表的自回归语言模型有 ELMO 和 GPT。

1.1 优点

在处理生成类自然语言处理任务时，就是从左向右的，比如文本摘要，机器翻译等，自回归语言模型天然匹配这个过程。

1.2 缺点

该模型是单向的，只能利用上文或者下文的信息，不能同时利用上文和下文的信息。

2 自编码语言模型（AE）

自动编码器的逻辑过程是指原始 input（设为 x）经过加权（W 和 b)、映射（Sigmoid）之后得到 y，再对 y 反向加权映射回来成为 z。通过反复迭

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

瑞雪兆我心

关注关注

18
点赞
踩
15

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
打赏
打赏
打赏举报

举报

【NLP Transformer】机器学习中自回归、自编码、Seq2Seq模型的区别

weixin_49986678的博客

04-18

1647

本文讨论自回归模型、自编码模型、Seq2Seq模型这三种编码器-解码器（encoder-decoder）架构的重叠和差异。我们首先会介绍编码器-解码器架构的基础知识，以提供最必要的背景知识。本文还简要介绍了经典或Vanilla（香草，计算机领域是普通的标准的、无扩展的意思）Transformer架构。接着，我们转向自回归模型，紧接着会介绍自编码模型，并且会看到当这两种模型组合时，我们就得到了Seq2Seq或者叫序列到序列模型。

Seq2Seq，自回归，自编码介绍

zhaosuyuan的博客

08-07

396

Seq2Seq，自回归，自编码

参与评论您还未登录，请先登录后发表或查看评论

自回归语言模型（AR）和自编码语言模型（AE）

上帝是个娘们的博客

04-15

4892

自回归语言模型（Autoregressive LM）在ELMO／BERT出来之前，大家通常讲的语言模型其实是根据上文内容预测下一个可能跟随的单词，就是常说的自左向右的语言模型任务，或者反过来也行，就是根据下文预测前面的单词，这种类型的LM被称为自回归语言模型。GPT 就是典型的自回归语言模型。ELMO尽管看上去利用了上文，也利用了下文，但是本质上仍然是自回归LM，这个跟模型具体怎么实现有关系。E...

自回归模型

最新发布

weixin_53507617的博客

04-17

820

如果 {εt} 为白噪声，服从 N(0,σ2)，a0,a1,...,ap(ap≠0) 为实数，就称 p 阶差分方程。(3)是一个 p 阶自。

自回归和自编码

wang6562009的专栏

04-26

1320

以前看论文和博客的时候经常看到自回归模型，自编码模型，感觉云里雾里的。今天搜了搜，看清了本质。 自回归语言模型，说白了就是通过上文一步一步预测下文，不能看见未来信息的模型。像坚持只用单向Transformer的GPT就是典型的自回归语言模型 自编码语言模型就是类似于bert 这种，使用了 mask LM 的，可以使用上下文语境信息的。这也是为什么bert 是双向的原因。区别与bi lstm 这种，使用两层网络的 ...

自回归语言模型（Autoregressive LM）& 自编码语言模型（Autoencoder LM）

qq_43060870的博客

09-09

2605

自回归语言模型（Autoregressive LM）简单的说，Autoregressive 就是根据上文预测下文或者根据下文预测上文，典型的代表：GPT ，其他代表ELMO等。缺点：只能利用上文或者下文的信息，不能同时利用上文和下文的信息 自编码语言模型（Autoencoder LM） Autoencoder 是根据上下文语境来进行预测，典型的代表：BERT。缺点：输入时引入[Mask]标记，导致Train阶段和Fine-tuning阶段不一致的问题。 ...

Auto-Regressive（自回归）、Auto-Encoding（自编码）

u013250861的博客

10-26

2595

参考资料： Seq2seq, autoregressive, autoencoding的区别，三百字讲清楚

自回归语言建模

顺其自然~专栏

09-20

683

自回归语言模型是一种基于序列数据的概率分布，通过建模当前词语与前面已生成词语的条件概率来预测下一个词语的统计模型。其核心思想是根据已生成的文本序列来预测下一个词语的概率分布，并依此不断生成后续的文本，直到形成完整的序列。

XLNet：广义自回归预训练语言模型 2019 NIPS

u013602059的专栏

07-13

1310

论文链接：https://arxiv.org/pdf/1906.08237v1.pdf 代码链接：https://github.com/zihangdai/xlnet 导读今天学习的是谷歌大脑的同学和 CMU 的同学的论文《XLNet: Generalized Autoregressive Pretraining for Language Understanding》，于 2019 年发表于 NIPS，目前引用超 300 次。 XLNet 是一个广义自回归预语言模型，它在 Transformer-XL .

大语言模型-GLM论文

11-05

大语言模型的预训练架构可以分为三类：自编码模型（Autoencoding Models）、自回归模型（Autoregressive Models）和编码器-解码器模型（Encoder-Decoder Models）。其中，BERT 是一种基于自编码模型的预训练架构，...

【Models】Transformer 之 自回归、自编码、序列到序列

songxia928_928的博客

03-27

1315

自然语言处理（NLP）的核心挑战是建模序列数据的依赖关系。自2010年代以来，三大范式主导了序列模型的发展：**自编码（Autoencoding）**、**自回归（Autoregressive）**和**序列到序列（Seq2Seq）**。它们如同光谱的三个端点：自回归聚焦单向生成，自编码擅长双向理解，Seq2Seq则架起输入输出的桥梁。本文将深入解析三者的技术本质、架构差异及应用边界。

什么是自回归语言模型（Causal Language Modeling）？

qq_42755230的博客

10-11

1942

详细介绍了啥是自回归模型，它的特点和一些应用场景

区分自回归（Autoregressive）和自编码（Autoencoder）

Hit the keyboard hard

04-10

2418

自回归模型可以类比早期的统计语言模型，根据上下文预测下一个单词。 自编码模型（如BERT），在输入中随机掩盖一个单词，在与训练过程中，根据上下文，预测被掩盖的单词。这种行为可以视为是降噪（denosing）。 ...

【Transformers】第 4 章：自回归和其他语言模型

sikh_0529的博客

11-03

3568

自动编码语言模型”中查看了自动() 语言模型的详细信息，并研究了如何从头开始训练 AE 语言模型。在当前章节中，您将看到() 语言模型的理论细节，并学习如何在您自己的语料库上对它们进行预训练。您将学习如何在您自己的文本上预训练任何语言模型，例如()，并将其用于各种任务，例如()。您将了解 A 的基础知识() 模型并在您自己的() 数据上训练(完成本章后，您将大致了解 AR 语言模型及其在应用程序中的各种用例，例如摘要、释义和机器翻译。技术要求使用 AR 语言模型变压器架构。

自编码、自回归、Seq2Seq的区别是什么？

Mr Xi's Blog

11-17

1558

自编码器用于学习数据的紧凑表示，自回归模型用于生成序列，而Seq2Seq模型用于处理序列到序列的映射任务，例如翻译。在深度学习中，这三种模型结构可以用于不同的任务，根据任务的性质和需求选择合适的模型结构是很重要的。自编码（Autoencoder），自回归（Autoregressive），和Seq2Seq（Sequence-to-Sequence）是深度学习中三个不同的模型结构，它们在任务和设计上有一些关键的区别。最常见的应用是机器翻译，其中输入是源语言的一句话，输出是目标语言的对应翻译。

LM：自回归语言模型 VS 自编码语言模型

qq_36857518的博客

12-08

434

https://zhuanlan.zhihu.com/p/163455527

GPT的自回归语言建模（Autoregressive Language Modeling）

二分掌柜的

11-30

1124

flyfish

自编码/自回归/seq2seq 真的理解了吗？

flying_1314的博客

03-25

1311

宏观来讲，当今的天下，可以说是transformer的天下，今天下三分，分别是 自编码（Autoencoder），自回归（Autoregressive），和怎么理解呢？encoder（左派）自编码代表：bertseq2seq代表：bart自回归代表：gpt上面那个图大家看了可能就会首先有个宏观的了解，接下来，会稍微细节简单说一下，之后相关的文章也会跟进。

什么是自回归和自编码语言模型？

岁月如歌

02-25

4741

1、自回归语言模型 在ELMO／BERT出来之前，大家通常讲的语言模型其实是根据上文内容预测下一个可能跟随的单词，就是常说的自左向右的语言模型任务，或者反过来也行，就是根据下文预测前面的单词，这种类型的LM被称为自回归语言模型。GPT 就是典型的自回归语言模型。ELMO尽管看上去利用了上文，也利用了下文，但是本质上仍然是自回归LM，这个跟模型具体怎么实现有关系。ELMO是做了两个方向（从左到右以及...