本篇博客是逐字翻译的原论文,链接的博客对有用信息进行了提取
自然语言处理NLP 2022年最新综述:An introduction to Deep Learning in Natural Language Processing-优快云博客
NLP综述
摘要
自然语言处理(NLP)是人工智能的一个分支,涉及通过人类语言进行交互的系统和算法的设计和实现。由于深度学习的最新进展,NLP应用程序的性能得到了前所未有的提升。在本文中,我们对深度学习技术在NLP中的应用进行了调查,重点关注深度学习在各种任务中表现出更强的影响。 此外,我们探索、描述和修改NLP研究中的主要资源,包括软件、硬件和流行的语料库。最后,我们强调了深度学习在NLP中的主要局限性和当前的研究方向。
1.简而言之
自然语言处理(NLP)是人工智能的一个分支,充满了与语言相关的复杂、复杂和具有挑战性的任务,如机器翻译、问题回答、摘要等。NLP涉及模型、系统和算法的设计和实现,以解决理解人类语言的实际问题。
我们可以将NLP分为两个主要分支,即基础研究和应用研究。关于基础研究,任务包括有语言建模、形态分析、句法处理或解析以及语义分析。应用研究的任务包括有从文本中自动提取相关信息(例如,命名实体及其之间的关系),语言之间的文本翻译,文本摘要,问答,分类和文档的聚类。
由于深度学习的最新进展,NLP应用程序的性能得到了前所未有的提升,引起了机器学习社区越来越大的兴趣。例如,在机器翻译中,基于短语的最先进的统计方法已经逐渐被神经机器翻译所取代,由巨大的深度神经网络组成,获得了更好的性能。[1]类似地,基于字典、本体和句法语法规则的命名实体识别的早期方法已经被循环架构[2]和深度学习模型所取代。大型神经网络已被证明优于传统的ML算法,如SVM。首先,这些模型通常可以用单一的端到端体系结构进行训练,而且它们不需要传统的任务特定特征工程,这使得它们的采用很方便。其次,深度神经网络能够处理大量的训练数据。然而,如果我们考虑与自然语言的语义分析相关的任务,语义注释数据的有限可用性(通常需要专门的人工努力)已经减缓了神经方法的扩散。
最近的模型也开始在各种任务上超过人类的表现,例如问答[3]或检测欺骗性内容[4]。
然而,即使最近的技术开始在各种任务上达到优异的性能,仍然有几个问题需要解决,例如计算成本、结果的可再现性和缺乏可解释性。在过去的几年里,关于深度学习和《自然语言处理》已经出版。鉴于该领域的快速进展,我们只考虑最近的调查,即自2019年以来的调查。[5][6][7][8]
[9]
我们的论文旨在成为一个教程机器学习社区,它提供了(i)主要NLP任务的分类,(ii)分析当前的问题和今后的工作,重点是再现性问题,(iii)描述软件和硬件资源以及NLP中使用的主要语料库。具体来说,[5]中的作者调查了经典神经网络语言模型的不同架构及其改进。[9]从文本表示学习的角度综述了深度学习模型。[8]简要介绍了NLP和深度神经网络,并讨论了如何使用深度学习来解决NLP中当前的问题。[7]对受益于深度学习的NLP的不同方面和应用进行了分类和讨论。最后,文献[6]中的调查重点是跨语言词嵌入模型。
2.任务和应用
由于无处不在的人机交互,NLP技术目前被用于多个不同的任务,涵盖多个领域。大多数现代自然语言处理应用可分为以下几类:
序列分类
这一类NLP问题是成熟的分类任务。设是一组输入序列,其中每个序列S
,S包括有一系列的tokens,
。设
是一系列可能的分类。与机器学习中常见的分类问题类似,序列分类的目的是找到一个函数
。相关的任务有:(i)情感分析,其目的是根据极性对短文本进行分类;(ii)文档分类,找到文档的主题(例如,体育、金融……);(iii)回答句子选择,其目标是从给定段落/文本中选择最佳句子来回答输入问题。
成对序列分类
根据两个不同序列的相似性、语义和意义进行比较和分类。通常,成对序列分类是一种二元分类任务,给定两个不同的序列作为输入,如果它们表达相同的意思返回+1,否则-1: