神经网络多轮对话系统(续)

本文介绍了一种通过集成多种神经网络结构(如CNN、LSTM和Bi-LSTM)来改进Ubuntu语料库对话系统的基线模型的方法。实验结果显示,在单一模型中LSTM表现最佳,而集成所有模型后性能得到显著提升。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

简述

文章与神经网络多轮对话系统一脉相承,文章的主要贡献在于,将几种网络结构的结果集成,取得了好于任一单一网络的结果。

文章全名:Improved Deep Learning Baselines for Ubuntu Corpus Dialogs

网络结构

前作的结构可以进一步抽象成

缺图

中间的NN可以是CNN, LSTM或Bi-LSTM,对应的图示为

缺图

其中CNN沿用了CNN用于文本分类中提到的网络结构,前作的结果,三种结构的结果与集成的结果的对比

缺图

单一结构下,LSTM最佳,Bi-LSTM稍差,CNN最差,三者集成之后,有明显提高。

集成的方法非常简单,取各单一结构结果的平均。

输入层用了GloVe产出的词向量。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值