基于少样本学习的文本生成与自动语音识别系统对比研究
在自然语言处理领域,语义控制的文本生成(M2T)和自动语音识别(ASR)是两个重要的研究方向。本文将围绕这两个方面展开,介绍基于少样本学习的M2T自然语言生成器的研究成果,以及不同自动语音识别系统的性能对比。
少样本学习的M2T自然语言生成器
为了提高开放域对话系统Athena中M2T响应生成器的质量和覆盖范围,研究人员使用基于提示的学习方法创建了新的神经模型。具体来说,他们基于GPT - Neo和Jurassic - 1分别创建了Athena - GPT - Neo和Athena - Jurassic,并在Athena的知识图谱领域(如电影、音乐、电视和体育)以及Viggo语料库的视频游戏对话行为MRs上进行了少样本(2、3、10)提示学习实验,同时还尝试了多种提示格式,并进行了域内和跨域测试。
以下是Viggo对比GPT - Neo和Jurassic的人类指标示例:
| ID | Input MR | Output - Athena - GPT - Neo | Output - Athena - Jurassic |
| — | — | — | — |
| V1 | confirm = yes, name = Tony Hawk’s Pro Skater 3, release_year = 2001, genres = sport | You mean the Tony Hawk’s Pro Skater 3 that has got a sport genre? | Gotcha! So you’re referring to the Tony Hawk’s Pro Skater 3 spor
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



