
算法研究
文章平均质量分 83
FlameLiu
这个作者很懒,什么都没留下…
展开
-
字符串匹配算法研究(一)
字符串匹配算法研究(一) 上星期拜读了2004年中国IOI集训队中朱泽园(当时就读南京市外国语学校)的一篇论文《多串匹配算法及启示》,并将其中的部分算法在理解的基础上用C++和Java做了实现。现将本人的理解与代码帖出,请读者不吝赐教。 首先我把该算法要解决的问题重新描述一下:即给定m个长度不等的模式串S1,S2,...,Sm以及一篇长度为n的正文T,求min({s|整数s∈[0,n-原创 2008-02-29 10:10:00 · 6598 阅读 · 0 评论 -
字符串匹配算法研究(二)
在《字符串匹配算法研究(一)》一文中主要介绍了多串匹配问题和解决单串匹配问题的KMP算法,接下来我们可以利用其思想解决多串匹配问题。 不过在此之前需要引入单词查找树的概念。 单词查找树是一棵无限延伸的26叉树,每个结点的26个通向子结点的边分别被命名为a,b,...,z;(之前曾提到过,将原文和模式串假设成仅由26个小写英文字母组成)。这样从根结点到任一非根结点p路径上的字母均可组成一字原创 2008-03-03 15:43:00 · 2608 阅读 · 3 评论 -
Java词频统计算法(使用单词树)
许多英语培训机构(如新东方)都会出几本“高频词汇”的书,主要内容是统计近几年来各类外语考试中屡次出现的高频词汇,帮助考生减少需要背的生词的数量。但这些高频是如何被统计出来的呢?显然不会用手工去计算。 假如我们已经将一篇文章存在一字符串(String)对象中,为了统计词汇出现频率,最简单直接的做法是另外建一个Map:key是单词,value是次数。将文章从头读到尾,读到一个单词就到Map里查一原创 2008-10-27 18:20:00 · 5768 阅读 · 3 评论