1.Maven依赖
<dependency>
<groupId>org.apache.opennlp</groupId>
<artifactId>opennlp-tools</artifactId>
<version>1.9.1</version>
</dependency>
2. 自定义词典
IKanalyzer可通过配置Ikanalyzer.cfg.xml进行自定义词库,
* 但有时需要在程序中根据不同的文章动态调用不同的词库进行分词,
* 这就需要自定义Configuration类来实现。
首先,拷贝Ikanalyzer源码中的DefaultConfig.java,改为MyConfiguration.java,然后做如下改写:
package com.xhq.DOG.config;
/**
* IKanalyzer可通过配置Ikanalyzer.cfg.xml进行自定义词库,
* 但有时需要在程序中根据不同的文章动态调用不同的词库进行分词,
* 这就需要自定义Configuration类来实现。
*
*
*/
import java.io.IOException;
import java.io.InputStream;
import java.util.ArrayList;
import java.util.InvalidPropertiesFormatException;
import java.util.List;
import java.util.Properties;
import org.wlte