问题:
a.项链上串着n颗宝石。项链有一个头,有一个尾。宝石分为很多种,我们只关心其中k种最漂亮的宝石。我们想从项链上找到一个连续的一串宝石,使得这一串包含了全部k种给定的宝石。求满足要求的最短宝石链的长度w。
上面的两个case都是这个问题的实例,要求在o(n)的时间内解决这个问题。n为项链的长度(文章的长度)。 算法: 1. 设置两个标志位,一个begin,一个end。初始化begin=end=1。一个距离变量dist记录路径长度。 2. end从前向后遍历,并保存这两个标志位之间每种关键宝石(关键字)的个数,直到满足所有的种类都包含。此时,dist=end-begin. 3. 然后保持end不动,begin从前向后走,每走一步,观察是否仍满足条件,直到不满足为止。更新dist.当begin在第一个不满足的条件的位置的时候,end增加,直到满足,观察是否要更新dist。循环上面的过程直到end>n. 观察下复杂度:end从1最后到n,是o(n),begin在最坏条件下走到队尾也是o(n),所以整体是o(n)的复杂度。
b.一篇文档,里面有顺序的n个单词(忽略标点)。文档自然有开头和结尾。单词有很多(都转换成了原型),但我们只关心搜索引擎用户输入的k个关键词。我们想从文档中选取最短的一个连续片段,包含了所有的k个关键词。这个连续片段w的长度称为这篇文档的最小窗。最小窗越小,我们认为文档越匹配检索词。