基于AWD - LSTM的习语句子分类与物联网农业数据预测系统
基于AWD - LSTM的习语句子分类
在自然语言处理(NLP)领域,准确分类习语和字面句子对于构建更精确的NLP应用(如机器翻译、信息检索和问答系统)至关重要。本文提出了一种使用迁移学习和AWD - LSTM的分类模型。
背景知识
- 迁移学习 :在深度学习中,迁移学习是一种监督学习技术,它利用从一个任务中获得的知识应用到另一个相关任务中。对于NLP的迁移学习,它具有通用性,适用于不同文档大小、标签数量和类型的任务,使用单一的架构和训练方法,且不需要额外的领域内文档或标签。与不使用迁移学习的模型相比,微调模型无需从头学习,能以较少的计算时间获得较高的准确率。
- ULMFiT :通用语言模型微调(ULMFiT)采用新技术在广泛的通用领域语料库上预训练语言模型(LM),并在目标任务上进行微调。它具有通用性,适用于不同文档大小、标签数量和形式的任务,使用单一架构和训练方法,无需自定义特征工程或预处理,也不需要额外的领域内文档或标签。其核心思想是利用像Wikitext - 103(10300万个标记)这样的大型语料库准备语言模型,然后将预训练模型的编码器与自定义头部模型(如用于分类)结合,并使用判别式学习率在多个阶段进行微调。
- AWD - LSTM :AWD - LSTM(ASGD权重丢弃LSTM)是NLP中最流行的语言模型,它使用丢弃连接方法、平均随机梯度下降方法和其他一些正则化策略。长短期记忆网络(LSTM)是一种时间循环神经网络(RNN),主要用
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



