pattern-exploiting training (PET)--Few-Shot Learners

最新推荐文章于 2024-06-09 09:52:01 发布

翻译最新推荐文章于 2024-06-09 09:52:01 发布 · 1k 阅读

·

2

·

文章标签：

#深度学习 #人工智能

NLP 同时被 2 个专栏收录

51 篇文章

订阅专栏

33 篇文章

订阅专栏

本文介绍了一种名为Pattern-Exploiting Training (PET) 的技术，该技术通过将文本转化为完形填空问题来实现小样本学习，且所需参数远少于GPT-3等大型模型。文中还提出了一种PET的有效改进版本，支持预测多个token，实验结果显示其性能接近GPT-3。

1 简介

本文根据2021年《It’s Not Just Size That Matters：Small Language Models Are Also Few-Shot Learners》翻译总结的。

GPT-3有1750亿的参数，它拥有惊人的小样本学习（few-shot）能力。
而本文主要讲另一种方式，pattern-exploiting training (PET)，模式开发训练。是将文本输入转化成完形填空（cloze）问题。所需参数很少。
同时本文提出了PET的一个简单有效的修改版，支持预测多个token。

2 Pattern-Exploiting Training

在这里插入图片描述

在这里插入图片描述

PVP（pattern-verbalizer pairs）,如上图：
在这里插入图片描述

3 PET with Multiple Masks

PET引入多个token，如下图a，计算两个概率q并取概率较高的（如下图ble），接着将ble带入下图b，继续计算剩下token的概率。
在这里插入图片描述

4 实验结果

可以看到PET参数较少，但取得了和GPT-3不相上下的结果。

在这里插入图片描述

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。