中文分词 mmseg4j 1.7.2 版发布,其实两天前就发布了,只是没有写博客而已。与引版本发布的还有 1.6.2,两者基本一样,只是词库的数据结构不同,1.7的是键树,1.6的是数组与二分查找。
mmseg4j 1.7.2 版的主要更新:
[list]
[*] 修复由 1.7-beta 升级到 1.7 版的 bug:添加 lowerCaseFilter 后的一个 bug: NullPointerException。
[*] 核发程序与 lucene 和 solr 扩展分开打包, 同时给出低版本的 lucene 扩展(lucene 1.9 到 2.2; lucene 2.3)
[/list]
如何从源码编译:
下载源码:[URL="http://mmseg4j.googlecode.com/files/mmseg4j-1.7.2-src.zip"]mmseg4j-1.7.2-src[/URL] 或 [URL="http://mmseg4j.googlecode.com/files/mmseg4j-1.6.2-src.zip"]mmseg4j-1.6.2-src[/URL]。解压到如:e:/mmseg4j-1.7.2-src。然后到这个目录,运行:
或
上面编译是在 solr 1.3 和 lucene 2.4 环境下的。如果您要在 低版本的 lucene 中使用,到 e:/mmseg4j-1.7.2-src/contrib/lucene_1_9 或 e:/mmseg4j-1.7.2-src/contrib/lucene_2_3 运行:
说明:到 contrib 下的子项目中编译的话,先要编译 mmseg4j,contrib/lucene_1_9 可以支持到 2.2。
如果有任何疑问、建议,欢迎到论坛 [URL]http://groups.google.com/group/mmseg4j/topics?hl=zh_CN[/URL] 讨论。,或与我联系 chenlb2008#gmail.com。
还要感谢网友“苦涩可乐”提示 NullPointerException 的bug。
mmseg4j 1.7.2 版的主要更新:
[list]
[*] 修复由 1.7-beta 升级到 1.7 版的 bug:添加 lowerCaseFilter 后的一个 bug: NullPointerException。
[*] 核发程序与 lucene 和 solr 扩展分开打包, 同时给出低版本的 lucene 扩展(lucene 1.9 到 2.2; lucene 2.3)
[/list]
如何从源码编译:
下载源码:[URL="http://mmseg4j.googlecode.com/files/mmseg4j-1.7.2-src.zip"]mmseg4j-1.7.2-src[/URL] 或 [URL="http://mmseg4j.googlecode.com/files/mmseg4j-1.6.2-src.zip"]mmseg4j-1.6.2-src[/URL]。解压到如:e:/mmseg4j-1.7.2-src。然后到这个目录,运行:
ant
或
ant build
上面编译是在 solr 1.3 和 lucene 2.4 环境下的。如果您要在 低版本的 lucene 中使用,到 e:/mmseg4j-1.7.2-src/contrib/lucene_1_9 或 e:/mmseg4j-1.7.2-src/contrib/lucene_2_3 运行:
ant build
说明:到 contrib 下的子项目中编译的话,先要编译 mmseg4j,contrib/lucene_1_9 可以支持到 2.2。
如果有任何疑问、建议,欢迎到论坛 [URL]http://groups.google.com/group/mmseg4j/topics?hl=zh_CN[/URL] 讨论。,或与我联系 chenlb2008#gmail.com。
还要感谢网友“苦涩可乐”提示 NullPointerException 的bug。