Neural Natural Language Processing for Long Texts: A Survey of the State-of-the-Art

本文概述了深度神经网络在处理长文本NLP中的应用,重点关注文档分类和摘要,探讨了多层感知机、CNN、RNN、LSTM、Transformer等架构,以及BERT、ELECTRA和GPT等技术。同时,讨论了长文档分析的挑战和解决方案,如稀疏注意力、层次Transformer和循环Transformer,并涵盖了情感分析和公开数据集。

本文是针对NLP处理长文本的一个综述,针对《Neural Natural Languag Processing for Long Texts: A Survey of the State-of-the-Art》的翻译。

摘要

在过去的十年里,深度神经网络(DNN)的采用极大地促进了自然语言处理(NLP)。然而,长文档分析的需求与短文本的需求大不相同,而在线上传的文档规模不断增加,使得对长文本的自动理解成为一个关键的研究领域。本文有两个目标:a)概述了相关的神经构建块,从而作为一个简短的教程;b)调查了长文档NLP的最新技术,主要关注两个中心任务:文档分类和文档摘要。长篇文本的情感分析也包括在内,因为它通常被视为文档分类的一个特殊情况。因此,本文关注文档级分析。它讨论了长文档NLP的主要挑战和问题,以及当前的解决方案。最后,介绍了相关的、公开可用的、带注释的数据集,以便于进一步研究。

1 引言

2 相关之前的综述

3 用于长文档分析的深度神经网络

3.1 一般神经架构

3.1.1 多层感知机

3.1.2 卷积神经网络

3.1.3 循环神经网络

3.1.4 LSTM网络

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

UnknownBody

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值