文献阅读(三):Deep Learning Based Text Classification A Comprehensive Review
- Abstract
- 1 INTRODUCTION
- 2 DEEP LEARNING MODELS FOR TEXT CLASSIFICATION用于文本分类的深度学习模型
-
- 2.1 Feed-Forward Neural Networks前馈神经网络
- 2.2 RNN-Based Models
- 2.3 CNN-Based Models
- 2.4 Capsule Neural Networks胶囊神经网络
- 2.5 Models with Attention Mechanism 注意力机制
- 2.6 Memory-Augmented Networks记忆增强网络
- 2.7 Graph Neural Networks图神经网络
- 2.8 Siamese Neural Networks暹罗神经网络
- 2.9 Hybrid Models混合模型
- 2.10 Transformers and Pre-Trained Language Models预训练模型
- 2.11 Beyond Supervised Learning超出监督学习
- 总结
- 3 HOW TO CHOOSE THE BEST NEURAL NETWORK MODEL FOR MY TASK 如何为任务选择最佳的神经网络模型
- 4 TEXT CLASSIFICATION DATASETS 文本分类数据集
- 5 EXPERIMENTAL PERFORMANCE ANALYSIS 实验性能分析
- 6 CHALLENGES AND OPPORTUNITIES 挑战与机遇
- 7 CONCLUSION 结论
- 题目——基于深度学习的文本分类综述
- 出处:CoRR abs/2004.03705 (2020)
Abstract
在各种文本分类任务中,基于深度学习的模型已经超越了基于经典机器学习的方法,包括情感分析、新闻分类、问题回答和自然语言推理。在本文中,我们对近年来开发的150多个基于深度学习的文本分类模型进行了全面的回顾,并讨论了它们的技术贡献、相似性和优势。我们还提供了一个总结超过40流行的数据集广泛用于文本分类。最后,定量分析了不同深度学习模型在流行基准上的性能,并讨论了未来的研究方向。
附加关键词短语:文本分类、情感分析、问答、新闻分类、深度学习、自然语言推理、主题分类。
1 INTRODUCTION
文本分类,也称为文本分类,是自然语言处理(NLP)中的一个经典问题,其目的是为句子、查询、段落和文档等文本单元分配标签或标记。它的应用范围很广,包括问答、垃圾邮件检测、情感分析、新闻分类、用户意图分类、内容审核等。文本数据可以来自不同的来源,包括web数据、电子邮件、聊天、社交媒体、机票、保险索赔、用户评论以及来自客户服务的问题和答案,举几个例子。文本是极其丰富的信息来源。但是,由于文本的非结构化性质,从文本中提取见解是具有挑战性和耗时的。
文本分类既可以通过人工标注,也可以通过自动标注进行。随着工业应用中文本数据的规模不断扩大,文本自动分类变得越来越重要。自动文本分类的方法可以分为两类:
•基于规则
订阅专栏 解锁全文
5204

被折叠的 条评论
为什么被折叠?



