
机器学习
nearvoid
这个作者很懒,什么都没留下…
展开
-
SnowNLP:处理中文文本内容
这是一个比yaha更加强大的中文分词工具。yaha简单来说只是使用最短路径算法(Dijstra)实现了中文分词,而SnowNLP则实现了词性标标准,情感分析,文本分类,转换成拼音,繁体转简体,文本关键词提取,文本摘要提取,tf,idf,Tokenization(分割成句子),文本相似。 为实现上面的功能用到了不少的算法和模型,比如textrank、贝叶斯分类器、隐含马尔科夫模型等。对于学习研究中原创 2013-12-08 21:01:45 · 11054 阅读 · 0 评论 -
隐马尔科夫模型学习总结
隐马尔科夫模型,这个久违的老朋友。大三上学期在实验室的时候,由于实验室项目需用到语音识别,所以就使用了微软的Microsoft Speech SDK,也关注了一下语音识别的原理,其中有以HMM作为模型进行识别的。后来实验室的机器人项目中上位机的软件使用到了人脸识别的功能。实验室有关于识别的工程源代码,但是工程庞大,结构复杂,并且里面有很多没有用到的功能,并且程序经常莫名其妙的跑飞,还存在严重的内存原创 2014-04-18 10:10:21 · 2091 阅读 · 0 评论 -
MLPack之HMM学习
这个开源的机器学习的库使用到了boost中的很多库,包括tokenizer(分词器);也用到了Armadillo也地方,这是一个基于c++语言开发的线性代数开发库,主要用于矩阵计算。 1、目录结构: 其中 hmm_generate_main.cpp:随机的产生一个观测序列然后得到相应的隐藏的状态序列。 hmm_loglik_main.cpp:对于给定的观测序列计算其在给定的HMM参数下原创 2014-04-20 00:02:57 · 4123 阅读 · 1 评论