使用 IKSegmenter 进行字符串的分词操作
package com.zsoft.test;
import java.io.StringReader;
import org.wltea.analyzer.core.IKSegmenter;
import org.wltea.analyzer.core.Lexeme;
/**
* 测试 IK Analyzer 分词架构中的独立使用分词方法 IK Segmenter
* 需要加载 IKAnalyzer2012_u6.jar
* @author zsoft
*/
public class IKSegmenterTest {
public String parse(String content, boolean useSmart) throws Exception{
StringReader sr = new StringReader(content);
// 参数2为是否使用智能分词
// true:使用智能分词
// false:使用最细粒度分词
IKSegmenter ikSegmenter = new IKSegmenter(sr, useSmart);
Lexeme word = null;
String w = null;
StringBuffer sb = new StringBuffer();
while((word = ikSegmenter.next()) != null){
w = word.getLexemeText();
if(sb.length() > 0){
sb.append("|");
}
sb.append(w);
}
return sb.toString();
}
public static void main(String[] args) {
String text = "我们在测试智能分词的运行效果实例";
try {
IKSegmenterTest ikSegmenterTest = new IKSegmenterTest();
String strs = ikSegmenterTest.parse(text,true);
System.out.println("使用智能分词结果:"+strs);
strs = ikSegmenterTest.parse(text, false);
System.out.println("最细粒度分词结果:"+strs);
} catch (Exception e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}
}
使用智能分词结果:我们|在|测试|智能|分词|的|运行|效果|实例
最细粒度分词结果:我们|我|们|在|测试|智能|分词|的|运行|效果|果实|实例
本文介绍了一个使用IKAnalyzer分词器的Java测试类,该类通过IKSegmenter实现对中文字符串的分词操作。文章提供了两个示例,分别展示了智能分词与最细粒度分词的效果。
954

被折叠的 条评论
为什么被折叠?



