
临时学习笔记包
每次学习了,就要做笔记,不然,我怕的大脑装不下它·············
码字界陈冠希
一个立志拿代码泡妞的男人·····帅是我的缺点······
展开
-
Nearth---全文检索技术(luncen)/006(全文检索流程-查询索引)
查询索引: 1)用户查询接口: 用户输入查询条件的地方。 例如:百度的搜索框。 2)把关键词封装成一个查询对象:要查询的域,要搜索的关键词。 3)执行查询: 根据要查询的关键词对应域上进行搜索。 找到关键词,根据关键词找到对应的文档。 4)渲染结果: 根据文档的ID找到文档对象。 对关键词进行高亮显示。 分页处理 最终展示给用户看。 ...原创 2019-11-23 10:10:50 · 171 阅读 · 0 评论 -
Nearth---全文检索技术(luncen)/006(全文检索流程-创建索引库)
创建索引: 基于关键词列表来创建一个索引,保存到索引库中。 索引库中:索引,document对象,关键词和文档的对应关系。 通过词语找到文档,这种索引的结果叫倒排索引结果。 ...原创 2019-11-23 10:03:24 · 296 阅读 · 0 评论 -
Nearth---全文检索技术(luncen)/005(全文检索流程-分析文档)
分析文档: 就是分词的过程 1,根据空格进行字符串的拆分,得到一个单词单词列表。 2,把单词统一转换成小写。 3,去除标点符号 4,去除停用词 停用词:无意义的词。 每个关键词都封装成一个Term对象中。 Term中包含两部分类容:关键词所在的域,关键词本身。 不同的域中拆分出来的相同的关键词是不同Term. ...原创 2019-11-23 09:56:17 · 155 阅读 · 0 评论 -
Nearth---全文检索技术(luncen)/004(全文检索流程-创建文档对象:)
全文检索流程-创建文档对象: 什么是luncen? luncen是一个基于Java开发全文检索工具包。 实现全文检索的流程? 创建索引: 1)获得文档:原始文档,要基于那些数据来进行搜索,那么这些数据就是原始文档。 搜索引擎,使用爬虫来获得原始文档。 站内搜索,数据库中的数据。 案例:直接使用IO流来读取磁盘上的文件 2)构建文档对象 对应每个原始文档创建一个Document...原创 2019-11-23 09:47:52 · 227 阅读 · 0 评论 -
Nearth---全文检索技术(luncen)/003(全文检索技术的应用场景)
全文检索的应用场景: 1,搜索引擎 百度,360搜索,谷歌,搜狗。 2,站内搜索 论坛搜索,微博,文章搜索。 3,电商搜索 淘宝搜索,京东搜索。 4,只要是有搜索的地方就可以使用全文检索技术。 ...原创 2019-11-23 09:35:11 · 434 阅读 · 0 评论 -
Nearth---全文检索技术(luncen)/002(全文检索的概念)
什么是全文检索? 数据的分类: 1,结构化数据 格式固定,长度固定,数据类型固定 eg:数据库中的数据 2,非结构化数据 word文档,pdf文档,邮件,html,txt 格式不固定,长度不固定,数据类型不固定。 数据的查询: 1,结构化数据的查询 SQL语句,查询结构化数据的方法。简单,速度快。 2,非结构化数据的查询 从文本文件中找出包含spring单词的文件 a,...原创 2019-11-23 09:34:11 · 356 阅读 · 0 评论 -
Nearth---全文检索技术(luncen)/001
Lucene: 全文检索技术:什么是全文检索?如何实现全文检索? Lucene实现全文检索的流程:创建索引,查询索引。 配置开发环境 入门程序 分析器的分析过程:测试分析器的分词效果,第三方中文分析器。 索引库的维护:添加、删除,修改文档 索引库的查询:使用Query子类查询,使用QueryParser查询。 ...原创 2019-11-23 09:32:48 · 198 阅读 · 0 评论