1.下载mmseg4j的压缩包,如果不能翻墙下载,请到百度上搜索下载,以下为google的官网链接:
wget http://mmseg4j.googlecode.com/files/mmseg4j-x.x.x.zip
2.解压包并移动JAR包到指定位置
unzip mmseg4j-x.x.x.zip -d mmseg4j-x.x.x
将mmseg4j-x.x.x/mmseg4j-all-x.x.x-with-dic.jar复制到solr下的lib目录
3.配置相关文件
将schema.xml文件中所有的<tokenizerclass="solr.WhitespaceTokenizerFactory"/>
和
<tokenizer class="solr.StandardTokenizerFactory"/>
替换为
<tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory"mode="complex"/>
本文介绍如何在Solr中集成mmseg4j中文分词器,包括下载安装、配置等步骤,并提供了详细的命令示例。
9296

被折叠的 条评论
为什么被折叠?



