[论文学习]P-Tuning v2: Prompt Tuning Can Be Comparable to Fine-tuning Universally Across Scales and Task

原创

已于 2022-04-06 18:55:01 修改 · 1.9k 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#深度学习 #自然语言处理

于 2022-03-30 22:29:25 首次发布

P-Tuning V2是一种Prompt Tuning方法，在不同规模和任务中都能与微调媲美。该方法通过优化Prefix Tuning并应用于NLU任务，解决了序列标注等复杂问题。仅需调整0.1%参数量即可在多种模型规模上达到与微调相当的效果。

[论文学习]P-Tuning V2

P-Tuning v2: Prompt Tuning Can Be Comparable to Fine-tuning Universally Across Scales and Tasks

P-Tuning v2一种在不同规模和任务中都可与微调相媲美的Prompt-Tuning方法,但并不是一个全新的方法，将文本生成的Prefix-Tuning优化并适应到NLU任务中,成为一个跨规模和NLU任务的

动机

模型通用性:以前关于Prompt-Tuning的工作(或者说是P-Tuning v1)在正常大小的预训练模型中表现不够理想,100亿以上的参数量的预训练模型打败Fine-Tuning
任务通用性:现在的Prompt-Tuning不能很好地处理序列标注任务

首先，序列标注需要预测一连串的标签，而不是单一的标签。其次，序列标注通常预测的是无实际意义的标签，这对于将其转化为有效的verbalizers来说可能是个挑战

为了解决这两个问题,提出P-Tuning V2

方法

施法前摇

前缀微调

前缀微调（Li and Liang, 2021）最初是为自然语言生成（NLG）任务提出的，由[Prefix, x, y]三部分构成，Prefix为前缀，x为输入，y为输出。Prefix-tuning将预训练参数固定，Prefix参数进行微调：不仅只在embedding上进行微调，也在TransFormer上的embedding输入每一层进行微调。

假设我们有自回归模型GPT(transformer的结构，12层)，让z = [x;y]，聚合x和y， $X_{idx}$ 是x的索引， $_{idx}$ 是y的索引， $h_i(j)$ 是transformer第j步的输出， $h_i = [h_i(1),...,h_i(n)]$

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

simpsun 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。