lucene new Filed()字段属性说明

最新推荐文章于 2025-05-01 21:35:31 发布

原创最新推荐文章于 2025-05-01 21:35:31 发布 · 599 阅读

0 ·

CC 4.0 BY-SA版权

lucene 专栏收录该内容

3 篇文章

订阅专栏

本文详细介绍了Lucene中Field的配置选项，包括Index、Store、TermVector等属性的作用及使用场景，帮助理解如何针对不同需求合理配置Field。

1.如果要对某Field进行查找，那么一定要把Field.Index设置为ANALYZED或ANALYZED_NO_NORMS。ANALYZED会对Field的内容进行分词；而NOT_ANALYZED不会，只有全词匹配，该Field才会被选中。

2.如果Field.Store是No，那么就无法在搜索结果中从索引数据直接提取该域的值，取得值为NULL。如果需要提取该字段的值，需设置为YES

补充:

       Field.Store.YES:存储字段值（未分词前的字段值），可以取得该字段的存储的值
       Field.Store.NO:不存储,存储与索引没有关系，那么查询出来的结果会是NULL
       Field.Store.COMPRESS:压缩存储,用于长文本或二进制，但性能受损

       Field.Index.ANALYZED:分词建索引，分词匹配
       Field.Index.ANALYZED_NO_NORMS:分词建索引，但是Field的值不像通常那样被保存，而是只取一个byte，这样节约存储空间
       Field.Index.NOT_ANALYZED:不分词且索引，全字匹配
       Field.Index.NOT_ANALYZED_NO_NORMS:不分词建索引，Field的值去一个byte保存

       TermVector 表示文档的条目（由一个Document和Field定位）和它们在当前文档中所出现的次数
       Field.TermVector.YES:为每个文档（Document）存储该字段的TermVector
       Field.TermVector.NO:不存储TermVector 存储空间占用最小，节省内存空间
       Field.TermVector.WITH_POSITIONS:存储位置
       Field.TermVector.WITH_OFFSETS:存储偏移量
       Field.TermVector.WITH_POSITIONS_OFFSETS:存储位置和偏移量