Lucene
文章平均质量分 93
zouxiang_1993
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Lucene FST
Lucene FST1. FST简介FST, 全称Finite State Transducer, 中文翻译: 有限状态转换器或有限状态传感器。FST最重要的功能是可以实现Key到Value的映射,相当于HashMap<Key,Value>。FST的内存消耗要比HashMap少很多,但FST的查询速度比HashMap要慢。FST在Lucene中被大量使用,例如:倒排索引的存储,...原创 2019-03-16 11:20:03 · 8053 阅读 · 8 评论 -
Lucene分词基本概念
Lucene分词基本概念Lucene接收纯文本,分词之后写入索引。分词就是将一段文本拆分成多个词(Token),并产生与每个词相关联的一些属性(Attribute)的过程。TokenStream、PositionIncrement和PositionLengthLucene用TokenStream来表示分词的结果。一般情况下,TokenStream可以看做是一个顺序的Token流。例如,有...原创 2019-03-16 15:52:21 · 907 阅读 · 0 评论 -
Lucene中的同义词
Lucene中的同义词Lucene的TokenFilter中,有SynonymFilter和SynonymGraphFilter两种来处理同义词。SynonymFilter不能很好的处理多词同义词,已经被弃用,建议使用SynonymGraphFilterSynonymFilter 和 SynonymGraphFilter的比较假设有如下文本:fast wi fi network is d...原创 2019-03-16 16:50:28 · 1694 阅读 · 6 评论 -
Elasticsearch中的MatchQuery
MatchQueryMatchQuery是Elasticsearch中一种比较复杂的Query,在查询时会先被改写成一些低级Query的组合。TermQuery、SynonymQuery、BooleanQuery、PhraseQuery简介// TODOMatchQuery改写流程MatchQuery改写流程的入口: org.elasticsearch.index.search.Matc...原创 2019-03-16 17:03:00 · 8162 阅读 · 0 评论
分享