
分布式计算
文章平均质量分 83
yunlang2012
这个作者很懒,什么都没留下…
展开
-
搜索引擎开发笔记二
上回书说到已经为txt文件进行了简单的预处理,接下来就要开始建立索引了:)。 步骤:1.为要处理的内容建立索引 2.构建查询对象 3.在索引中查找 首先我们要在firstProject的“firstPoject.lucene.process”包下创建一个IndexProcesser。 代码如下package firstPr原创 2013-04-06 13:25:50 · 644 阅读 · 0 评论 -
搜索引擎开发笔记一
哇,开发一个搜素引擎,对于一个我这个刚上大一的新童鞋听到这个还是感觉鸭梨山大的。。。不过,借用王国维的《热爱生命》中的一句话,“既然选择了远方,便只顾风雨兼程”。我相信我们团队sunshine studio一定会交一份满意答卷的。话说工欲善其事,必先利其器。那么开发搜索引擎,我们需要什么工具呢? (参考书籍为人民邮电出版社的《开发自己的搜索引擎Lucene+Heritrix》)原创 2013-04-06 00:08:03 · 659 阅读 · 0 评论 -
搜索引擎开发笔记三
生命就像一盒巧克力,你永远不知道下一颗是什么滋味。——《阿甘正传》 消失了一周,我又回来了。。。 上回书说了Lucene的两个最重要的两个类Document和Field。Document的意义为文档,在Lucene,它代表一种逻辑文件。Lucene无法直接为物理文件建立索引。有时利用Document来与物理文件建立对应关系。但是,更多时候,Document和原创 2013-04-13 22:38:00 · 577 阅读 · 0 评论