
NLP
文章平均质量分 81
qianwenhong
揭谛揭谛,波罗揭谛,波罗僧揭谛,菩提萨婆诃
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
朴素贝叶斯模型(Naive Bayes Model,NB)理解
Bayes定理 P(A,B)=P(A|B)P(B); P(A,B)=P(B|A)P(A); P(A|B)=P(B|A)P(A)/P(B); 贝叶斯定理变形原创 2014-11-24 14:18:37 · 9762 阅读 · 0 评论 -
最大熵模型(Maximum Entropy Model, ME)理解
信息论的创始人Shannon认为,“信息室zhire”原创 2014-11-25 12:24:54 · 18126 阅读 · 1 评论 -
隐马尔可夫模型 (Hidden Markov Model,HMM)理解
隐马尔可夫模型 (Hidden Markov Model,HMM) 最初由 L. E. Baum 和其它一些学者发表在一系列的统计学论文中,随后在语音识别,自然语言处理以及生物信息等领域体现了很大的价值。到目前为止,它一直被认为是实现快速精确的语音识别系统的系统,自然语言处理过程的最成功的方法。原创 2014-11-26 10:49:10 · 11080 阅读 · 0 评论 -
中文分词软件包的使用
中文分词 (Chinese Word Segmentation) 指的是将一个汉字序列切分成一个一个单独的词。分词就是将连续的字序列按照一定的规范重新组合成词序列的过程。我们知道,在英文的行文中,单词之间是以空格作为自然分界符的,而中文只是字、句和段能通过明显的分界符来简单划界,唯独词没有一个形式上的分界符,虽然英文也同样存在短语的划分问题,不过在词这一层上,中文比之英文要复杂的多、困难的多。下面原创 2014-12-10 14:09:15 · 12984 阅读 · 0 评论 -
R语言 tm包的使用
R语言 tm 文本挖掘原创 2014-12-10 16:22:03 · 8496 阅读 · 0 评论