提示学习中的模型输出类型-答案类型

本文探讨了提示学习中不同类型的答案形态,包括单token答案、跨度答案和开放式文本。单token答案常用于分类任务,跨度答案适用于序列标注任务如NER和事件抽取,而开放式文本则用于生成任务如文本翻译。针对每种形态,模型的输出处理方式也有所不同,如需映射到特定标签或直接输出答案。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在提示学习中答案形状可以分为三种:

  1. 单token答案 ( single token)
  2. 跨度答案(span)
  3. 开放式文本(open ended text)

第一种 主要用于分类任务等只需要一个指示状态的

第二种用于 序列分类,比如ner, 关系抽取,事件抽取等需要从原文中获取文本作为结果的场景

第三种用于 生成任务,比如 文本翻译等。

对于第一第二种形态,需要在bert/bart之类模型输出后面接入mlp之类的映射layer 将输出 的logits映射 为需要的标签或跨度值

第三种就是直接输出 答案了。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值