关于IKAnalyzer自定义分词的使用方法

本文提供了一个使用IKAnalyzer进行文本分析的Java示例代码。该示例展示了如何通过IKAnalyzer识别自定义词典中的多字词,并统计这些词汇的数量。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

 

 

 

 

 

package util;

import java.io.StringReader;

import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.TokenStream;
import org.apache.lucene.analysis.tokenattributes.CharTermAttribute;
import org.wltea.analyzer.lucene.IKAnalyzer;
/*
 * 相关词典和xml放入src目录下
 */
public class IKUitl {
    /*
     * 出现自定义中词典关键字的次数
     */
    public static int IsStore(String content) throws Exception 
    {
       Analyzer analyzer = new IKAnalyzer(false);//禁止加载默认字典
       StringReader reader = new StringReader(content);
       TokenStream ts = analyzer.tokenStream("", reader);  
       CharTermAttribute term=(CharTermAttribute) ts.getAttribute(CharTermAttribute.class);
         int i =0;
          while(ts.incrementToken()){  
                   System.out.println(term);
                   if(term.toString().length()>1){
                      i= i+1;
                   }
                   
                }
                analyzer.close();
                reader.close();  
                return i;
                }
    public static void main(String[] args) throws Exception {
        
        System.out.println(IKUitl.IsStore("你麻痹"));
    }

}
 

 

转载于:https://my.oschina.net/xiaoshoubingliang/blog/714461

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值