
算法
文章平均质量分 51
zhouqi2014
这个作者很懒,什么都没留下…
展开
-
转载一篇LDA算法使用总结
最近在做基于LDA(Latent Dirichlet Allocation)的文本分类处理,开始学习和接触了LDA,因为代码采用的是Java,所以我选择的LDA开源工具是JGibbLDA,这个是LDA的Java版本实现,下载地址为:http://jgibblda.sourceforge.net/ ,当前最新版本为v1.0。同时对应的C++版本为GibbsLDA,下载地址为:http://gibbs转载 2014-12-16 21:28:22 · 3743 阅读 · 0 评论 -
基于用户的协同过滤算法
协同过滤算法在推荐系统领域占有及其重要的地位,协同过滤算法的出现甚至标志了智能推荐的出现。协同过滤算法大体上分为两类:基于用户的协同过滤和基于物品的协同过滤。近几年出现的对协同过滤算法的改进,大部分都是基于这两种算法。笔者最近学习了基于用户的协同过滤算法,所以在此做一个简单的总结,有不对之处请各位指出。基于用户的协同过滤算法的主要思想是基于用户A可能会喜欢与用户A特征相似的用户B所喜欢的物品。原创 2014-11-29 20:32:03 · 3263 阅读 · 0 评论 -
自然语言处理开源项目
1、Ansj中文分词 :http://www.oschina.net/p/ansj原创 2015-02-04 16:20:50 · 796 阅读 · 0 评论 -
Java笔记之抽象
抽象抽象是java里比较重要的一个概念,一个类 所有含有抽象方法的类都需要被声明为抽象类,用abstract关键词来声明抽象类和抽象方法。所有声明的抽象类必须被继承才有意义。public abstract class Dog{ public String name = "dog"; public abstract void Run(); public void SayHi()原创 2015-05-27 16:11:00 · 494 阅读 · 0 评论 -
TF-IDF 算法
近来写论文需要抽取文档的主题和关键词,所以研究了一些关于抽取文档关键词以及计算文本相似度的一些算法。TF-IDF是在抽取文档关键词,文档分类等领域比较经典的算法,我在很多本书中都看到过TF-IDE得身影,比如吴军的《数学之美》。个人感觉TF-IDE是一个非常精巧的算法,简单、实用且效果优良。好的算法并不一定是复杂的,一般来说好的算法都是精巧而简单的,但正是这些精巧而简单的算法可以为我们解决复杂原创 2015-01-07 14:57:30 · 2140 阅读 · 0 评论