给定一定数量的关键字,对任一篇文本,寻找文本中包含哪些关键字
例如关键字集合如下:
而待检测的文本如下:
当前算法的目的就是从test.txt中快速的检索有没有给定的keyWord.txt中的关键字
具体的代码下载地址是:http://download.youkuaiyun.com/detail/sinat_22013331/9551006,这部分代码是用C#写的,如果要java或者其他语言的版本,可以对照着改动一些。
这个文本处理需要一个算法, 普通的文本处理直接去遍历所有的关键字,但是这种算法太复杂,时间复杂度太高。
之前的文章中有说过,实际用到的算法,为了加快执行速度,都是在时间和空间上做的兑换,用存储空间