
nlp
zbxzc
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
sequence to sequence
论文 Sequence to Sequence Learning with Neural Networks原创 2017-01-21 12:11:32 · 1041 阅读 · 0 评论 -
attention model
自然语言处理中的Attention Model:是什么及为什么深度学习和自然语言处理中的attention和memory机制原创 2016-09-23 10:38:37 · 1675 阅读 · 0 评论 -
lda主题模型
其实这篇文章也可以叫gibbs抽样在lda主题模型中的应用。lda里的重头戏就是gibbs抽样。话说现在论文起名字也是技术活儿,一般人还把握不好,一样的内容起个不同的名字,被reject的几率有时还真不一样。lda主题模型又是一个有深厚数学背景的算法。主题模型(topic model)是一种使用概率的产生式模型来挖掘文本主题的新方法。Topic Model中假设,主题可以根据一定的规则原创 2015-12-02 19:17:36 · 3444 阅读 · 0 评论 -
HMM隐马尔科夫模型
马尔科夫过程在概率论及统计学中,马尔可夫过程(英语:Markov process)是一个具备了马尔可夫性质的随机过程,因为俄国数学家安德雷·马尔可夫得名。马尔可夫过程是不具备记忆特质的(memorylessness)。换言之,马尔可夫过程的条件概率仅仅与系统的当前状态相关,而与它的过去历史或未来状态,都是独立、不相关的。一个马尔科夫过程是状态间的转移仅依赖于前n个状态的过程。这个过程被称之原创 2015-06-20 23:06:57 · 4118 阅读 · 1 评论 -
条件随机场
马尔科夫随机场马尔可夫随机场(Markov Random Field)包含两层意思。马尔可夫性质:它指的是一个随机变量序列按时间先后关系依次排开的时候,第N+1时刻的分布特性,与N时刻以前的随机变量的取值无关。拿天气来打个比方。如果我们假定天气是马尔可夫的,其意思就是我们假设今天的天气仅仅与昨天的天气存在概率上的关联,而与前天及前天以前的天气没有关系。其它如传染病和谣言的传播规律,就是马尔原创 2015-11-30 23:54:16 · 2726 阅读 · 0 评论 -
文本关键词提取算法及自动摘要
蛙蛙推荐:蛙蛙牌关键词提取算法使用TextRank算法为文本生成关键字和摘要TextRank算法提取关键词的Java实现原创 2016-07-26 14:51:04 · 11436 阅读 · 0 评论 -
中文分词算法研究
分词算法有基于字典、基于规则和基于统计的,这里主要讲基于统计的方法。中文分词基本算法主要分类 中文分词算法总结介绍分词语料—— 中文分词入门之资源 互联网时代的社会语言学:基于SNS的文本数据挖掘字标注问题先看一个句子:我是一名程序员。将所有字分为4类,S表示单字,B表示词首,M表示词中,E表原创 2016-06-30 23:00:47 · 3003 阅读 · 1 评论 -
机器翻译
NLP 学习笔记 04 (Machine Translation)原创 2016-07-27 11:50:00 · 1032 阅读 · 0 评论 -
命名实体识别
方法有HMM、ME、crf、svm、mlp等基于HMM、ME、CRF的方法和分词,pos-tagging类似,字标注方法基于SVM以英文命名实体识别为例,将识别看成分类问题,从语料库中提取每个词及其上下文的特征,加上该词的标签,组成一个训练样本,训练svm分类器,完成之后对未标注语句即可进行识别。featureimport原创 2016-07-05 15:50:50 · 11404 阅读 · 2 评论 -
统计语言模型&word2vec
我们是这样理解语言的[我们是这样理解语言的-2]统计语言模型自然语言处理 - 语言模型(Language Modeling)NLP 学习笔记 01经典统计语言模型Statistical language model 统计语言模型语言模型n-gramn-gram语言模型NL原创 2016-06-16 22:43:53 · 2071 阅读 · 0 评论 -
TFIDF
文本向量表示及TFIDF词汇权值原创 2016-06-23 17:23:02 · 1987 阅读 · 0 评论 -
基于最大熵模型的人名分类
字标注问题先看一个句子:我是一名程序员。将所有字分为4类,S表示单字,B表示词首,M表示词中,E表示词尾。如果我们知道上述句子中每个字的类别,即:我/S 是/S 一/B 名/E 程/B 序/M 员/E 。/S那么我们就可以知道这个句子的分词结果:我 是 一名 程序员 。从这里可以看出,分词问题转化成了一个分类问题,即对每个字分类。最大熵模型的一般表达式原创 2015-11-26 17:06:15 · 1376 阅读 · 0 评论 -
情感分析
情感分析情感分析的新方法知乎-深度学习在情感分析中的应用的研究现状原创 2016-07-26 10:20:27 · 1835 阅读 · 0 评论 -
brown cluster
Brown et al. word clusteringBrown Clustering算法和代码学习NLP 学习笔记 06 (Brown Clustering && Global Linear Models)原创 2016-07-26 22:30:20 · 1557 阅读 · 0 评论 -
QA问答系统
QA相关的DL论文 CNN QA(Question and Answer)问答的theano和tensorflow代码原创 2016-07-27 17:25:32 · 3510 阅读 · 0 评论 -
MEMM最大熵马尔科夫模型
HMM MEMM CRF 区别 联系HMM,MEMM,CRF模型的比较标记偏置 隐马尔科夫 最大熵马尔科夫 HMM MEMM原创 2016-06-30 22:45:25 · 4800 阅读 · 0 评论 -
词性标注POS tagging
基于隐马尔可夫模型的有监督词性标注原创 2016-07-04 17:21:43 · 18326 阅读 · 0 评论 -
LSA及pLSA
Introduction to Latent Semantic AnalysisLatent semantic analysis note(LSA)原创 2016-06-16 21:07:16 · 1268 阅读 · 0 评论 -
RNN和LSTM
循环神经网络(RNN, Recurrent Neural Networks)介绍原创 2016-06-16 20:15:51 · 2181 阅读 · 0 评论 -
文本分类/聚类
基本文本聚类方法 python进行中文文本聚类实例(TFIDF计算、词袋构建)bag of words基于libsvm的中文文本分类原型文本分类 特征选取之CHI开方检验文本分类与聚类(text categorization and clustering)NLP系列(2)_用朴素贝叶斯进行文本分类(上) NLP系列(3)_用朴素贝叶斯进行文本分类(下)bayes文本分类文本分类实验总结classi...原创 2016-07-02 23:16:25 · 4734 阅读 · 0 评论