https://www.jianshu.com/p/ed7e1ebb2fb7
1、内部使用Lucene的倒排索引,为每个field建立一个docid列表(Posting list)
2、不同的field名字建立一个term dictionary(每个term对应原来的一个field),并且term本身进行索引(trie 树)
3、数据进行压缩
4、组合查询时的优化
注意点:
ID尽量有规律、去掉不必要的索引、去掉不必要的analyzed
本文介绍Lucene实现高效搜索的技术细节,包括利用倒排索引为每个字段建立文档ID列表,通过词典和Trie树对词条进行索引,并采用数据压缩技术提升存储效率。同时探讨了查询优化策略及注意事项。
https://www.jianshu.com/p/ed7e1ebb2fb7
1、内部使用Lucene的倒排索引,为每个field建立一个docid列表(Posting list)
2、不同的field名字建立一个term dictionary(每个term对应原来的一个field),并且term本身进行索引(trie 树)
3、数据进行压缩
4、组合查询时的优化
注意点:
ID尽量有规律、去掉不必要的索引、去掉不必要的analyzed
1459
1441
3375
313
1004

被折叠的 条评论
为什么被折叠?