
搜索引擎
云飞Ran
用代码构建出一个美丽的城堡。
展开
-
Lucene介绍
案例: 实现一个文件的搜索功能,通过关键字搜索文件,凡是文件名或文件内容包括关键字文件都需要找出来。还可以根据中文词语进行查询,并且需要支持多个条件查询 Lucene可以解决数据分类 1.结构化数据:指具有固定格式或有限长度的数据,如数据库,元数据 2.非机构化数据:指不定长或无固定格式的数据,如邮件,word 文档等磁盘上的文件非结构化数据方法 1.顺序扫描法 因为是顺序扫描...原创 2018-04-02 12:05:38 · 201 阅读 · 1 评论 -
Lucene创建索引流程
原始文档:互联网上的网页(爬虫或蜘蛛)、数据库中的数据、磁盘上的文件 创建文档对象(非结构化数据) 文档对象中的属性不叫属性现在成为域。 每个 Document 可以有多个 Field ,不同的 Document 可以有不同的 Field,同一个 Document 可以有相同的 Field(域名和域值都相同)。 每个文档都有一个唯一的编号,就是文档id 分析文档 将原始内容...原创 2018-04-04 08:16:41 · 4341 阅读 · 0 评论