
收藏 搜索引擎技术
文章平均质量分 88
yxin1322
这个作者很懒,什么都没留下…
展开
-
搜索引擎分词算法介绍
。原文:http://sf.hit.edu.cn/bbs/read.php?fid=1&tid=52&fpage=1。作者:不详搜索引擎分词算法介绍自动分词是基于字符串匹配的原理进行的;所谓自动分词方法,指的是汉字字符串匹配的进行方式。1. 最大匹配法 亦称MM法;其基本思想是这样的,假设自动分词词典(或词库)中的最长词条是i个字,则取被处理材料当前字符串序列中的前i个转载 2005-12-01 10:52:00 · 2739 阅读 · 0 评论 -
Lucene倒排索引原理
Lucene倒排索引原理 原文地址: http://sf.hit.edu.cn/bbs/read.php?fid=1&tid=50&fpage=1作者:不详 Lucene是一个高性能的java全文检索工具包,它使用的是倒排文件索引结构。该结构及相应的生成算法如下: 0)设有两篇文章1和2 文章1的内容为:Tom lives in G转载 2005-12-01 11:04:00 · 1622 阅读 · 0 评论 -
算法、编码时间、执行效率,一个都不能少——写在参加Google编程挑战赛之后
算法、编码时间、执行效率,一个都不能少——写在参加Google编程挑战赛之后 作者:yxin1322 blog:http://blog.youkuaiyun.com/yxin1322 转载请注明出处 本次Google编程挑战赛在中国举行,由www.topcoder.com承办,先后有1万多人报名参加。从昨天中午(12月11日)12点开始到今天中午12点的24小时是初赛,比赛者可以选择在这段时间原创 2005-12-14 11:39:00 · 3957 阅读 · 19 评论 -
Google编程挑战赛750分题(WordPath)程序拙解及感想
Google编程挑战赛750分题(WordPath)程序拙解及感想作者:yxin1322 blog:http://blog.youkuaiyun.com/yxin1322 转载请注明出处 上次介绍Google编程挑战赛的文章里已经发了我做的250分题的程序,地址如下: (http://blog.youkuaiyun.com/yxin1322/archive/2005/12/14/55204原创 2005-12-20 17:20:00 · 1693 阅读 · 4 评论 -
用C#实现的简单PL0 to C 编译器
用C#实现的简单PL0 to C编译器作者:yxin1322 blog:http://blog.youkuaiyun.com/yxin1322 转载请注明出处 这个程序是我《编译原理》的期末大作业,要求实现PL0到C语言的编译器,其实叫翻译器更贴切点。程序的实现目标是能把具有基本Pascal语法的pl0语言源程序转换成C语言程序。pl0支持变量定义、条件语句、循环语句、赋值语句,变量的控原创 2005-12-28 12:33:00 · 4994 阅读 · 1 评论 -
巧用二叉树原理求解集合的幂集
巧用二叉树原理求解集合的幂集作者:yxin1322 blog:http://blog.youkuaiyun.com/yxin1322 转载请注明出处 幂集是《离散数学》集合论中一个重要的概念,集合在《离散数学》中定义如下:集合是一个元概念,它研究对象的全体,通常用大写字母表示集合。如集合A,集合B。集合的表示方式有两种,分别是例举法和描述法。 如一个由大于1小于5的整数组成的集原创 2006-01-08 23:45:00 · 3525 阅读 · 2 评论