《自然语言处理实战入门》文本生成 ---- 初探

最新推荐文章于 2024-01-18 02:07:51 发布

shiter

最新推荐文章于 2024-01-18 02:07:51 发布

阅读量883

点赞数 1

CC 4.0 BY-SA版权

分类专栏：自然语言处理实战入门【Generative AI重制版】文章标签：文本生成 GPT-2 NLP 自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/wangyaninglm/article/details/110946966

自然语言处理实战入门【Generative AI重制版】专栏收录该内容

140 篇文章 ¥29.90 ¥99.00

订阅专栏

超级会员免费看

文章大纲

简介
三行代码生成文章
没有好机器不用做的gpt-2 文本生成实验
狗屁不通文章生成器
参考文档

简介

文本生成目前主要试用的是GPT-2 模型

基本上只要了解 Transformer 架构，你馬上就懂 GPT-2 了。因為该语言模型的本质上就是 Transformer 里的 Decoder：
在这里插入图片描述

Gpt-2简述

在过去的一年中，BERT、Transformer XL、XLNet 等大型自然语言处理模型轮番在各大自然语言处理任务排行榜上刷新最佳纪录，可谓你方唱罢我登场。其中，GPT-2 由于其稳定、优异的性能吸引了业界的关注

今年涌现出了许多机器学习的精彩应用，令人目不暇接，OpenAI 的 GPT-2 就是其中之一。它在文本生成上有着惊艳的表现，其生成的文本在上下文连贯性和情感表达上都超过了人们对目前阶段语言模型的预期。仅从模型架构而言，GPT-2 并没有特别新颖的架构，它和只带有解码器的 transformer 模型很像。

然而，GPT-2 有着超大的规模，它是一个在海量数据集上训练的基于 transformer 的巨大模型。GPT-2 成功的背后究竟隐藏着什么秘密？本文将带你一起探索取得优异性能的 GPT-2 模型架构，重点阐释其中关键的自注意力（self-attention）层，并且看一看 GPT-2 采用的只有解码器的 transformer 架构在语言建模之外的应用。

作者之前写过一篇相关的介绍性文章「Th

了解本专栏

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

shiter 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。