- 博客(4)
- 收藏
- 关注
原创 RNN和LSTM
rnn 循环神经网络,(Recurrent Neural Network)循环神经网络的主要用途是处理和预测序列数据。在全连接神经网络或者卷积神经网络中,都素hi从输入层到隐藏层再到输出层的,层与层之间都的全连接的,但每层之间的结点是无连接的。这就导致当前神经元没有前一个的记忆。而RNN的隐藏层之间的结点是有连接的,RNN的当前隐藏的输入包含输入层的输出和上一个隐藏层的输出。下图是一个单独的循...
2018-08-02 21:15:17
5987
1
转载 自然语言处理之数据平滑方法
在自然语言处理中,经常要计算单词序列(句子)出现的概率估计。但是,算法训练的时候,预料库中不可能包含所有可能出现的序列,因此为了防止对训练样本中为出现的新序列概率估计值为零,人们发明了不少可以改善估计新序列出现的概率算法,即数据的平滑。最常见的数据平滑算法包括如下几种: Add-one (Laplace) smoothing Add-k smoothing Backoff...
2018-08-02 10:33:48
9920
原创 词向量
词向量的来历Distributed representation 最早是 Hinton 在 1986 年的论文《Learning distributed representations of concepts》中提出的。Distributed representation的意思是分布式表示,通常被称为“Word Representation”或“Word Embedding”,中文用词向量表示...
2018-07-31 20:18:25
6911
原创 NLP的文本预处理
NLP介绍NLP(nature language processing)是计算机领域与人工智能领域的一个重要方向,研究实现人与计算机之间有效通信的方法,是一门融合语言学、计算机科学和人工智能于一体的学科。文本获取文本语料库的获取现在已经比较方便了,可以根据模型类型选择相应的总和语料库或者某个方向的语料库。例如中文维基语料(下载地址https://dumps.wikimedia.org/...
2018-07-31 11:38:51
1628
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅