
搜索引擎/lucene/实时搜索
葑岚
网络广告的精准推荐,海量数据的分布式计算http://weibo.com/larryspace
展开
-
理解lucene内几个核心概念
核心索引类:IndexWriter创建一个新的索引并且添加文档到一个已有的索引中,可以对索引进行增删改操作,但是不能查找。Directory:Lucene 索引的存放位置,是一个抽象类实现类: FSDirectory:在文件系统的目录中创建索引 RAMDirectory:在内存中创建索引Analyzer:分词器,在 IndexWr原创 2012-03-19 16:00:52 · 1438 阅读 · 0 评论 -
8 个基于 Lucene 的开源搜索引擎
转载自http://www.oschina.net/news/25408/searchengines-built-on-luceneLucene是一种功能强大且被广泛使用的搜索引擎,以下列出8种基于Lucene的搜索引擎,你可以想象他们有多么强大...Apache SolrSolr是一个高性能,采用Java5开发,基于Lucene的全文搜索服务器。文档通过Http利用XML加到一个转载 2012-02-07 12:14:23 · 1344 阅读 · 0 评论 -
社会化搜索与推荐浅析-聚类与分类
分类与聚类的主要区别在于:分类算法中,类别是已知的,类别数不变;而聚类中,类别是未知的,类别数不确定。分类需要依赖先验概率,把所有的数据点所组成的空间进行划分,组成一个个不同类别的集合,这些集合通常是不重合的 聚类:没有先验知识,属于无监督学习 适用与多维度,连续变量,基本的思路是概念建模和迭代优化 凝聚型层次聚类算法: 1:定义初始树,类似与B+树,所有数据都原创 2012-03-23 11:50:09 · 1759 阅读 · 0 评论 -
社会化搜索与推荐浅析-小例子说明什么是贝叶斯及证明过程
本文由larrylgq编写,转载请注明出处:http://blog.youkuaiyun.com/larrylgq/article/details/7395261作者:吕桂强邮箱:larry.lv.word@gmail.com贝叶斯:突破在于将先验概率转换成后验概率,但是原理很简单经典例子一:一座别墅在过去的 20 年里一共发生过 2 次被盗,别墅的主人有一条狗,狗平均每周晚上叫 3 次,原创 2012-03-23 11:51:43 · 2262 阅读 · 0 评论 -
社会化搜索与推荐浅析-朴素贝叶斯+laplace平滑文本分类器推导过程及java版实现
本文由larrylgq编写,转载请注明出处:http://blog.youkuaiyun.com/larrylgq/article/details/7395261作者:吕桂强邮箱:larry.lv.word@gmail.com朴素贝叶斯文本分类器用处挺广的,但是网上很少有实现demo,所以写了个java的实现小demo朴素贝叶斯分类用于文本分类的正式定义如下: 1、设原创 2012-03-26 18:28:44 · 8337 阅读 · 3 评论 -
社会化搜索与推荐浅析-大数据下的实时搜索
本文由larrylgq编写,转载请注明出处:http://blog.youkuaiyun.com/larrylgq/article/details/7399237作者:吕桂强邮箱:larry.lv.word@gmail.com 当我们的数据大到一定的程度,无法通过RDBMS来处理时一般的做法是使用RPC/http+索引服务器+数据库来实现通常的做法是:使用cron等定期到数据库原创 2012-04-09 16:29:42 · 1857 阅读 · 1 评论