lucene-近音词查询

分析器通过Metaphone算法实现近音词查询,也可采用类似于Soundex的其它可行的算法

public void testKoolKat() throws Exceptoin{

RAMDirectory directory=new RAMDirectory();

Analyzer analyzer=new MetaphoneReplacementAnalyzer();

 

IndexWriter writer=new IndexWriter(directory,analyzer,true);

Document doc=new Document();

doc.add(Field.Text("contents","cool cat"));

writer.addDocument(doc);

writer.close();

IndexSearcher searcher=new IndexSearcher(directory);

Query query=QueryParser.parse("kool kat","contents",analyzer);

 

Hits hits=searcher.search(query);

}

public class MetaPhoneReplacementAnalyzer extends Anaylyer{

public TokenStream tokenStream(String fieldName,Reader reader){

return new MetaphoneReplacementFilter{

new LetterTokenizer(reader));

}

}

}

public class MetaphoneReplacementFilter extends TokenFilter{

publicstatic final String METAPHONE="METAPHONE";

privateMetaphone metaphoner=new Metaphone();

publicMetaphoneReplacementFilter(TokenStream input){

super(input);

}

publicToken next() throws IOException{

Token t=input.next();

if (t==null) return null;

try{

return newToken(metaphoner.encode(t.termText()),t.startOffset().t.endOffset(),METAPHONE);//设置语汇单元的token类型。

}

catch(EncodeException e){

return t;

}

}

}

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值