Domain Adaptive Dialog Generation via Meta Learning

本文提出了一种基于元学习的领域自适应对话生成方法(DAML),该方法利用多源域数据训练一个对话模型,仅需少量目标域样本即可适应新领域。DAML采用模型无关元学习(MAML)算法,通过两步梯度更新在不同任务间学习通用特征,以端到端的方式实现高效领域适应。在SimDial数据集上,DAML在模拟对话任务中表现出优越性能,超越了零样本对话生成(ZSDG)等基线方法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Abstract

Domain adaptation 是对话系统构建中一个非常重要的任务,因为我们每天都要为不同的需求创建不同的对话任务。

我们提出一种 domain adaptive dialog generation method based on meta-learning (DAML). DAML 是一个可以端到端训练的对话系统模型,能够从多个 task 中学习,然后只需很少的训练样本就能适应新的 domain.

我们通过将 model-agnostic meta-learning 应用到对话系统中来使用多个 rich-resource single- domain 的对话数据训练了一个对话模型。这个模型能够在新的 domain 上只使用很少的训练样本就能学习一个有竞争力的对话系统。DAML 中的 两步梯度更新 使得模型可以在多个任务之间学到 通用特征

我们在一个模拟的对话数据集上对我们的方法进行了评估并且得到了 SOTA 的性能。

1 Introduction

现代的个人助理,例如 Alexa 和 Siri, 由数千个单领域的面向任务的对话系统组成。由于领域特定的知识,每个对话系统都是不同的。一个端到端可训练的对话系统需要成千上万的对话数据用于训练。由于对话数据需要

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值