自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 RNN和LSTM

rnn 循环神经网络,(Recurrent Neural Network)循环神经网络的主要用途是处理和预测序列数据。在全连接神经网络或者卷积神经网络中,都素hi从输入层到隐藏层再到输出层的,层与层之间都的全连接的,但每层之间的结点是无连接的。这就导致当前神经元没有前一个的记忆。而RNN的隐藏层之间的结点是有连接的,RNN的当前隐藏的输入包含输入层的输出和上一个隐藏层的输出。下图是一个单独的循...

2018-08-02 21:15:17 5987 1

转载 自然语言处理之数据平滑方法

在自然语言处理中,经常要计算单词序列(句子)出现的概率估计。但是,算法训练的时候,预料库中不可能包含所有可能出现的序列,因此为了防止对训练样本中为出现的新序列概率估计值为零,人们发明了不少可以改善估计新序列出现的概率算法,即数据的平滑。最常见的数据平滑算法包括如下几种: Add-one (Laplace) smoothing Add-k smoothing Backoff...

2018-08-02 10:33:48 9920

原创 词向量

词向量的来历Distributed representation 最早是 Hinton 在 1986 年的论文《Learning distributed representations of concepts》中提出的。Distributed representation的意思是分布式表示,通常被称为“Word Representation”或“Word Embedding”,中文用词向量表示...

2018-07-31 20:18:25 6911

原创 NLP的文本预处理

NLP介绍NLP(nature language processing)是计算机领域与人工智能领域的一个重要方向,研究实现人与计算机之间有效通信的方法,是一门融合语言学、计算机科学和人工智能于一体的学科。文本获取文本语料库的获取现在已经比较方便了,可以根据模型类型选择相应的总和语料库或者某个方向的语料库。例如中文维基语料(下载地址https://dumps.wikimedia.org/...

2018-07-31 11:38:51 1628

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除