
搜索引擎
文章平均质量分 70
fan_7
这个作者很懒,什么都没留下…
展开
-
中文分词免费源码资源
中文分词免费源码资源来源:http://blog.donews.com/windshow/category/70837.aspx1。http://www.chinesecomputing.com/nlp/segment.html此链接介绍了很多分词资源。注意看其第二项(A Simplified Chinese Segmenter written in Perl )。里面有Per转载 2007-03-01 22:46:00 · 1429 阅读 · 0 评论 -
lucene结构说明中文文档
来源:www.matrix.com.cn本文定义了Lucene(版本1.3)用到的索引文件的格式。Jakarta Lucene是用Java写成的,同时有很多团体正在默默的用其他的程序语言来改写它。如果这些新的版本想和Jakarta Lucene兼容,就需要一个与具体语言无关的Lucene索引文件格式。本文正是试图提供一个完整的与语言无关的Jakarta Lucene 1.3索引文件格式的规格定转载 2007-03-05 22:48:00 · 780 阅读 · 0 评论