
分词相关文章
sealbird
这个作者很懒,什么都没留下…
展开
-
百度的分词算法【转】
百度的分词算法【转】2009-11-05 16:16这篇文章主要参考中科院软件所张俊林先生在2005年11月写作的《搜索引擎设计实用教程》的分词部分,提供的查询关键词范例也源于该文。搜索引擎本身并不提供信息,因此用户需要在搜索引擎的搜索框键入关键词进行查询以获取信息,然而由于中文信息检索存在的自身特点,比如中文语词之间没有空格,中文的语法分析和语义理解与英原创 2009-11-27 13:43:00 · 499 阅读 · 0 评论 -
基于Lucene的最流行的分词法
基于Lucene的最流行的分词法2009-11-05 16:141. 基本介绍:paoding :Lucene中文分词“庖丁解牛” Paoding Analysisimdict :imdict智能词典所采用的智能中文分词程序mmseg4j : 用 Chih-Hao Tsai 的 MMSeg 算法 实现的中文分词器ik :采用了特有的“正向迭代最细粒度切分算法“,多子处理器分析模式2. 开发者原创 2009-11-27 13:56:00 · 588 阅读 · 0 评论 -
ICTCLAS 中科院分词系统 代码 注释 中文分词 词性标注
ICTCLAS 中科院分词系统 代码 注释 中文分词 词性标注风暴红QxRed 发表于 2006-04-20 20:38:50 中科院分词系统概述这几天看完了中科院分词程序的代码,现在来做一个概述,并对一些关键的数据结构作出解释〇、总体流程考虑输入的一句话,sSentence="张华平欢迎您"总体流程:一、分词 "张/华/平/欢迎/您"二、posTagging原创 2009-12-09 13:35:00 · 2089 阅读 · 2 评论