nrgrep函数分析(1)--搜索流程简析

最新推荐文章于 2024-08-16 10:37:49 发布

原创最新推荐文章于 2024-08-16 10:37:49 发布 · 1k 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#tree #returning #structure #算法 #数据结构 #linux

My Workspace 专栏收录该内容

6 篇文章

订阅专栏

NR-grep是一款由智利大学Gonzalo Navarro开发的高效模式串匹配工具，它基于BNDM算法及其扩展，支持精确及近似搜索，并能根据模式复杂度平滑调整性能。本文介绍了NR-grep的执行流程，包括参数处理、模式分析、文件搜索、结果报告及清理过程。

NR-grep是由智利大学的Gonzalo Navarro开发的一款“快速、灵活的模式串匹配工具”，其优点在于Nrgrep几乎全部基于BNDM算法及其扩展，性能随着搜索问题复杂度的增加而平滑下降（Agrep剧烈下降）。而且支持精确搜索和允许错误的近似搜索（grep不支持近似搜索）；而且Nrgrep将性能平滑性看做是模式复杂度的一个函数，一旦预测到BNDM算法搜索的代价太大，他将更换为Shift-And算法。

但是Nrgrep的一个缺点在于不支持多串匹配，我们的实验便是想在Nrgrep的基础上，设计出利用GPU性能提高的多字符串匹配程序。

/* nrgrep程序共有33个文件 */

首先让我们来分析一下Nrgrep程序的大体执行流程。

一、/* get the options */ and /* some consistency checks */

Nrgrep程序从Shell.c的main (int argc, char **argv)开始，第一步便是获取用户输入的后缀(如-i等后缀参数)，这里调用了Linux中的特有头文件getopt.h中的getopt函数（ps：getopt.h为开发Linux带参数程序提供特有的方便），然后根据不同的后缀做出不同的switch-case处理(各后缀作用将在以后分析)。

二、/* get the pattern */

然后，开始对搜索字符串作分析（分析第一个字是否’^’，最后一个字是否’$’）和调用预处理函数searchPreproc (patt)——在search.c内定义，其参数patt传递了一个pattern。该函数的作用为“Preprocesses pat and creates a searchData structure for searching”，为搜索结构确定、初始化了搜索类型（如：SIMPLE,EXTENDED,REGULAR）,不同类型指向了不同的处理函数：