关于 小叮咚中文分词 .net版本发布的变化

博主介绍小叮咚中文分词有Java和C#两个版本,决定主要更新Java版,.NET版在Java class基础上转化。尝试用IKVM.NET将Java jar文件转换成同名的.NET dll,Java测试结果正常,但.NET测试结果不正确,推测是转换过程出问题,待后续解决。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

关于 小叮咚中文分词 .net版本发布的变化

现在几乎每天都有朋友给我写信,要求交流小叮咚中文分词的实现。我现在实现的有java和C#两个版本。同样的算法逻辑,用 java 和 C#写两边可不是有趣的事情 。于是自然而然想起了 关于lucene发展和多语言实现的方向 中采用的方法,于是决定以后主要更新java版本的中文分词算法,而.net版本的中文分词则在java class基础上转化过来。

很早的时候我的一篇blog介绍过:基于.NET的Java虚拟机IKVM介绍 。于是今天就尝试了一把,整个过程还算顺利。下面是我的转换过程:


X:\ikvmbin-0.14.0.1\ikvm\bin>ikvmc -target:library X:\XXXX\chinese_sentence_splitter.jar
Note: output file is "chinese_sentence_splitter.dll"
Note: automatically adding reference to "e:\programming\java&.net\ikvmbin-0.14.0.1\ikvm\bin\ikvm.gnu.classpath.dll"

通过上面的命令可以把 java jar 文件转换成 同名的 .net dll。

在java中测试的结果如下:


但在.net中测试的结果却不正确:


这很显然是IKVM.NET在转换过程中出现了问题。

由于第一次使用IKVM.NET,因此这个问题还需要在以后有时间解决一下。也希望有相关经验的朋友多多指导.


相关连接:

多么乐
小叮咚中文分词

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值