【LLM】Prompt_tuning 预训练方式

原创

于 2025-01-13 21:08:20 发布

· 922 阅读

·

23

·

版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#prompt #自然语言处理 #人工智能 #深度学习

文章目录

4 Prompt-Tuning

4.1 NLP任务四种范式

目前学术界一般将NLP任务的发展分为四个阶段，即NLP四范式：

第一范式：基于「传统机器学习模型」的范式
第二范式：基于「深度学习模型」的范式
第三范式：基于「预训练模型+fine-tuning」的范式
第四范式：基于「预训练模型+Prompt+预测」的范式

4.2 Prompt-Tuning 提示微调

通过让下游任务取迁就预训练模型,将fine-tuning的下游目标任务转换为pre-training的预训练任务
执行步骤:
- 构建模板(Template Construction): 通过人工定义,自动搜索,文本生成的方法,三个部分从与给定句子相关的一个含有[MASK]标记的模板,并拼接到原始文本中,获得输入:
  - It was [MASK].，并拼接到原始的文本中，获得Prompt-Tuning的输入：[CLS] I like the Disney films very much. [SEP] It was [MASK]. [SEP]`。
  并复用预训练好的MLM分类器,得到[mask]预测的各个token的概率分布
- 标签词映射(Label Word Verbalizer): 建立映射关系,把[mask]的词分类
- 训练: 根据verbalizer 获得指定的lavel word 的预测概率分布,并采用交叉信息熵训练,。此时因为只对预训练好的MLM head进行微调，所以避免了过拟合问题。

4.3 PET模型

PET模型提出两个很重要的组件：

Pattern（Template） ：记作T, 即上文提到的Template，其为额外添加的带有[mask]标记的短文本，通常一个样本只有一个Pattern（因为我们希望只有1个让模型预测的[mask]标记）。由于不同的任务、不同的样本可能会有其更加合适的pattern，因此如何构建合适的pattern是Prompt-Tuning的研究点之一；
Verbalizer ：记作V, 即标签词的映射，对于具体的分类任务，需要选择指定的标签词（label word）。例如情感分析中，我们期望Verbalizer可能是（positive和negative是类标签）。同样，不同的任务有其相应的label word，但需要注意的是，Verbalizer的构建需要取决于对应的Pattern。因此 如何构建Verbalizer是另一个研究挑战 。

4.4 Hard Prompt & Soft Prompt

Hard Prompt (离散提示)：是一种固定的提示模板，通过将特定的关键词或短语(真实的文本字符串)直接嵌入到文本中，引导模型生成符合要求的文本。这种提示方法的特点在于，提示模板是固定的，不能根据不同的任务和需求进行调整。

Soft Prompt (连续提示) ：

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。