Lattice CNNs for Matching Based Chinese Question Answering

本文提出了基于Lattice CNN的模型,用于中文问答中的短文本匹配,以解决词不匹配和表达多样性的挑战。Lattice CNN利用word lattice提取多粒度信息,对噪声有较好的处理能力。在DBQA和KBQA任务上,实验表明LCNs模型性能优越。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

读论文记录,请多多指教。

Lattice CNNs for Matching Based Chinese Question Answering

摘要:两个短文本之间存在词不匹配以及表达多样性的问题,这对于中文来说,更加严峻。本文提出一种新的 基于lattice的CNN模型。在处理基于匹配的中文问答问题中,能够利用word-lattice中固有的多粒度信息,且具有很强的处理噪声的能力。 对基于文档的问答和基于知识的问答任务进行了广泛的实验,实验结果表明,LCNs模型可以提取word lattice中丰富且有差别的信息,性能优于其他。

介绍

在自然语言处理任务中,中文存在分词的困扰,当前也不存在一种适用于任何场景的分词方法。文本匹配通常需要获取两个句子之间多粒度的相关性。例如“Chinese people have high quality of life”的划分,其通常被划分为“chinese-citizen-life-quality-high",但若将其与"chinese-live-well"进行匹配,“Chinese-livelihood-live”的分词方式更好。
基于分布式表示可以概括传统词袋方法中离散词特征,现有工作使用神经网络模型来改善匹配。此外,还有融合词级和字符级信息的工作,在某种程度上可以缓解不同分段之间的不匹配,但是这些解决方法仍然受到原始词序结构的困扰。
对于基于文档的问答问题,匹配度反映对一个给定的问题,一个句子是他的回答的概率,问题和回答来源不同,因此会存在风格和句法结构都不同的问题。对于基于知识的问答,一个关键任务是对知识库的谓词短语来匹配问题的关系表达式。
图1

本篇论文提出一种多粒度的方法用于中文问答中的短文本匹配,该方法利用lattice CNNs从word lattice中提取句子级的特征。LCNs不依赖单词或字符级的序列,将word lattice作为输入,所有可能的单词和字符都同等对待,且具有他们各自的上下文,从而可以在每一层进行交互。对于每一层的每个单词,LCNs能够通过池化的方法以不同的粒度捕捉其不同的上下文单词。
作者对两个中文问答任务(DBQA,KBQA)进行实验,验证了LCNs的性能,同时还发现该方法能够更好的获取句子的多粒度信息,且由于其

评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值