安装好mmseg(中文分词)及csft(coreseek fulltext)之后,进入到csft-3.1.tar.gz解压后的目录csft-3.1。进入其子目录api,再进入其子目录java。使用命令cat readme,可根据它的提示生成 sphinxapi.jar。
将 sphinxapi.jar导入到MyEclipse工程里面,在这里写一个简单的测试代码,访问coreseek:
import org.sphx.api.SphinxException;
import org.sphx.api.test;
public class SphinxTest {
public static void main(String args[]) throws SphinxException{
test.main(new String[]{"-h", "125.216.242.122","-i", "test1","-p", "3312","test"});
}
}
其中,-h指定连接到的主机,它是coreseek所在的主机。-i是coreseek安装的目标目录下etc子目录里面的csft.conf文件里面配置的索引名。-p指定端口号。最后的test是你要检索的关键字。更多的选项可将上述语句改为test.main(null);,参照工作区的输出。
当然,要能访问coreseek,前提是它的searchd进程已启动:sudo /usr/local/csft/bin/searchd(我们假设coreseek安装在 /usr/local/)。
好了,现在就参简单地在java中使用全文检索技术了,更多的拓展功能当然要改进csft-3.1/api/java里面的代码再生成 sphinxapi.jar,导入到MyEclipse工程里了。