循环序列模型-2

本文介绍如何使用递归神经网络(RNN)构建语言模型,包括文本预处理、词汇标记化及模型训练等关键步骤。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

本文来自于网易云课堂

语言模型和序列

在NLP中,构建语言模型是最基础也是最重要的工作之一,并且能用RNN很好的实现。所以,什么是语言模型呢?语言模型所做的就是它会告诉你某个特定的句子出现的概率是多少。
那么如何建立一个语言模型呢?你首先需要一个训练集,包含一个很大的英文文本语料库或者其他的语言的语料库。语料库是NLP的一个专有名词,意思就是很长的或者说是数量众多的英文句子组成的文本。假如说你在训练集中得到这么一句话,“cats average 15 hours of sleep a day” ,你要做的第一件事就是将这个句子标记化,意思就是建立一个字典,然后将每个单词都转换成对应的one-hot向量,也就是字典中索引。可能还有一件事是要定义句子的结尾,一般的做法是定义一个额外的标记EOS,另外这里忽略了标点符号的标记。另外还有一个问题,如果你的训练集中有一些词并不在你的字典中,这种情况下你可以将其替换为UNK,其代表未知词的标记。完成标志化的句子以后,下一步我们要构建一个RNN来构建这些序列的概率模型。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值