对话管理

本文探讨了对话系统中如何实现对话的多样性及避免重复提问的方法。通过在对话管理的马氏决策过程(MDP)模型中引入记忆机制,增强系统的上下文理解能力,并提出了具体的实现策略。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

对话管理不仅要能够完成对话,还要“漂亮”的完成对话。这个漂亮一方面让提取器尽量提对,没有太多错误。

另一方面对话要多种多样,在完成功能的基础上把话说的漂亮。所以应该在对话MDP模型里应该有对对话多样性的度量。

对话多样性1.同一个意思应该有多种表述2.不应该在同一个问题上“纠结”太长时间。

因为马氏决策过程只根据当前的系统对话状态去决策,过去的状态并不考虑进来。

而对话系统是需要一定的memory,最直观的解释就是人与人在对话过程中当前说的话可能会考虑到上几轮的对话内容。

如果仍然在马氏决策过程的这个框架内,应该如何改进MDP模型让它具有一定的memory。

目前的想法是在state里添加特征,因为state表征的就是多轮对话后造成的影响到现在是一个什么样子的状态。

那么解决方法就应该是这样: 1.同一个意思应该有多种表述:生成许多个对话模板,随机选择。

2.不应该在同一个问题上,“纠结”太长时间: 在state里添加上一次对话的动作,这样当同一个动作出现2次,就暂时不让它再出现。 因为重复询问主要集中在“re_requeset”这个动作上,所以没必要把所有的上一次动作都加入进去。

只需记录上一次动作是不是re_request动作即可。

另一种方法也可以通过增加槽的activity来实现:1 request_activity 2 confirm_activiyt 3.re_request_activity

而不用大范围的修改上层MDP的逻辑

StateSlot_stateIf_Activityfetch_infouser_attitudehistory_info==fetch_infouser_action
0000anyanyrequest
1001anyanyconfirm
2010anyanyRe_request
3011anyanyconfirm
4100anyanyconfirm
5101any==done
6101any!=Re_confirm
7120disanyDis_request
8120agranydone
9121dis!=Re_confirm
10121dis==Done
11121agr!=re_confirm
12121agr==done
132anyanyanyanyok

只需要在底层添加两个状态,上层mdp的逻辑不用大改

StateSlot_stateIf_Activityfetch_infouser_attitudehistory_info==fetch_infouser_action
14030anyanyrequest
15031anyanyconfirm
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值