大概就是关键词在哪些文档出现了,建立以关键词和docid的对应关系
网上铺天盖地就是这个。
如果关键词A比较常用,有1千万个docid,不同字段,,,那么这个索引该如何存储?
我们常规的分词字典都是上万的关键词。
:D
你用lucene,,那么lucene如何使用内存,内存里放了什么呢?
网上铺天盖地就是这个。
如果关键词A比较常用,有1千万个docid,不同字段,,,那么这个索引该如何存储?
我们常规的分词字典都是上万的关键词。
:D
你用lucene,,那么lucene如何使用内存,内存里放了什么呢?