54、语言模型与自编码器、生成对抗网络的前沿探索

语言模型与生成模型前沿探析

语言模型与自编码器、生成对抗网络的前沿探索

1. 语言模型的创新进展

2018 年被称为“NLP 的 ImageNet 时刻”,LSTM 和基于 Transformer 的架构在大型数据集上训练,取得了显著进展。以下是该时期一些重要的创新成果:
- ELMo :引入了基于语言模型的嵌入(Embeddings from Language Models,ELMo),这是从深度双向语言模型的内部状态学习到的上下文相关词嵌入。例如,“queen”在“Queen of the United Kingdom”和“queen bee”中的嵌入是不同的。
- ULMFiT :作者使用自监督学习在大型文本语料库上训练 LSTM 语言模型,然后在各种任务上进行微调。该模型在六个文本分类任务上大幅超越了现有技术水平,在大多数情况下将错误率降低了 18 - 24%。此外,通过仅在 100 个标记示例上微调预训练模型,就可以达到在 10,000 个示例上从头开始训练的模型的相同性能。
- GPT :使用类似 Transformer 的架构,通过自监督学习在大型数据集上进行预训练,然后在各种语言任务上进行微调。这些任务包括文本分类、蕴含关系判断、相似度计算和问答等。几个月后推出的 GPT - 2 架构更大(拥有超过 15 亿个参数),并且在许多任务上无需微调就能取得良好性能,实现了零样本学习(Zero - Shot Learning,ZSL)。一个较小版本(“仅”有 1.17 亿个参数)的 GPT - 2 模型及其预训练权重可在 https://github.com/openai/gpt - 2 上获取。

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值