Lucene第二天

1.field域

    Lucene根据文档中的域的属性,确定是否要分词、创建索引。

    三大属性:分词(tokenized):只有设置了分词属性为true,lucene才会对这个域进行分词处理。

                    索引(indexed):只有设置了索引属性为true,lucene才为这个域的Term词创建索引。

                    存储(stored):只有设置了存储属性为true,在查找的时候,才能从文档中获取这个域的值。

          特点:三大属性彼此独立;通常分词是为了创建索引;不存储这个域文本内容,也可以对这个域先分词、创建索引。

          域的常用类型:Field类型        是否分词        是否索引        是否存储

                                StringField      N                   Y                  Y或N

                                LongField        Y                   Y                  Y或N

                                FloatField        Y                   Y                  Y或N

                                StoredField      N                  N                  Y

                                TextField          N                  N                  Y

IKAnalyzer:IKAnalyzer继承Lucene的Analyzer抽象类,使用IKAnalyzer和Lucene自带的分析器方法一样,将Analyzer测试代码改为IKAnalyzer测试中文分词效果。

转载于:https://my.oschina.net/u/4162158/blog/3075952

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值