闲聊式对话系统

本文探讨了chitbot对话模型面临的挑战,如回复单一性、前后一致性、词汇重复及缺乏语境关联。介绍了使用LSTM、HRED及注意力机制等模型解决多轮对话问题,并讨论了如何通过引入变分结构、利用检索式模型及建模Persona来提升回复质量。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

chitbot 直接使用数据训练一个端对端模型

1、lstm模型

2、HRED 模型 用来处理端对端模型里面的多轮对话,可以将context内容包括进去,然后也将utterance进行表示

3、attention 模型  pointer network 

chanllenges:

a、回复单一的问题

      最大相互信息熵损失函数、对抗网络、引入变分结构(VHRED模型)、利用检索式模型来进行替代

b、回复的前后一致性  ---  可能的原因是 训练数据的问题,庞大多样性、噪声很大    

       对于有些问题可能是多对一、一对多; 因为训练数据可能来源于不同的人,不同的人会给予不同的回答

    对于同一个问题的不同表述,可能给予的答案是不一样的

persona-based response generation system ----- 对person来进行建模

c、word repetitions

    机器翻译 --- 在source sentence 和 target sentence中,source sentence中的每个词或者phase都是在target句子中有对应的

    现在的生成模型都是在神经机器翻译模型上进行改进的,但是在 dialogue中的一些词,可能question中的词在answer中,有一个词或者多个词,再或者没有词对应。

    使用 attention或者 self-attention 来进行限制

d、lack of grounding

 

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值