两百行写一个递归下降解析器

本文介绍了一个仅用255行Ruby代码实现的递归下降解析器(rdparser),该解析器能够处理复杂的语法规则,并生成清晰的语法树。通过具体示例展示了如何定义语法规则、解析输入字符串以及展示解析结果。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Peter Cooper 最近看到Peter Cooper 用Ruby 实现 了一个Recursive Descent Parser。让我惊讶的是,作者仅仅用了255 行Ruby 代 码就实现了。于是我决定分析一下这个神奇的rdparser。

先看看它怎么用吧。

初始化需要定义语法规则:如果左边是终结符,右边对于正则表达式;如果是非终结符,对于非终结符或终结符组成的字符串。并列规则用竖线("|")连接。

 

输出如下:

 

对照下面的图就更明白一些了。

rules

图上有一些位置上的错误,比如brkt-expression 的子结点从左至右的顺序应是(, expression, )。我是用ruby-graphviz 画的,有些问题还没找到解决办法。

rdparser 先把输入规则转换成hash。传给parse_section 分析,得到一个类似s-exp 的数列。最后交给text_syntax_tree 显示出来。

首先分析它是怎么把rules 转变成hash 的。我把代码简化了一下。

 

yield 获得代码块想调用g.×× 但没找到,这时发现了method_missing,把方法名和原本要传递给××方法的所有参数传递给它。

这里还要解释一下

 

经常看到这种用法,这次好好地查了一下。相当于以下代码:

 

这是用来检查是否定义了@h。

接着把起始规则(:main)和待解析的字串(content)传给parse。

 

to_sym 是把字符串变为symbol。Scanner 是作者定义的一个包装类。Scanner.new 其实很简单。

 

其中用到了strscan 库 的StringScanner 类。strscan是一个字符串扫描器库。StringScanner  对象是由被扫字符串和 " 扫描点 " 构成的 . 扫描点是一个索引值 , 它表示已扫描的位置 . 刚开始的时候 , 扫描点位于字符串头部 , 此时 ( 且只有此时 ) 扫描点将尝试进行匹配 . 若匹配成功则推进扫描点 .

重点是parse_section。伪代码:

parse_section(rule)

    @depth += 1

    rule 对应的各条并列的语法规则ruleset :

        对ruleset 的各个语法元素r :

            suboutput = []

            如果当前字符串的某个前缀能匹配上r :

                把[{非终结符=>匹配的字串}] 添加进suboutput

        如果全匹配上了 :

            @depth -= 1

            return output

框架如下:

 

sub_rulesets 把那些用竖线(“|”)分隔的规则断开。而sub_rules 把各条规则用空格断开的语法单元全部抽出来。接着一个接一个地分析这些语法元素。主要是根据后缀(s 就相当于正则表达式中的+,? 和正则表达式中的? 作用一模一样)分类讨论。

最后一个关键:match_for_rule,用来根据语法规则解析字串的内容。

 

Peter 还提供了一个显示词法解析树的打印程序:

如果是数组就依次显示各个元素;如果是hash 表,才进入正题,根据depth 缩进显示。

 

抛开注释和调试语句,真正的程序不到161 行。啊,god-like。

顺便说一句,把DEBUG 置为true 就可以看到浩如烟海的调试信息。作者调试的方法很有趣。还记得Ruby 的每条语句都是一个表达式吗,还记得布尔表达式的短路求值吗?

 

如果DEBUG 为false,就不会执行debug_message。

P.S.: 看了代码之后觉得Peter 大哥很牛,去翻了一下他的主页,原来他是Ruby Inside 的写手,写过N多作品。总之,神牛!

时间函数举例程序分析 2.程序源代码: #include "stdio.h" #include "time.h" void main() { time_t lt; /*define a longint time varible*/ lt=time(NULL);/*system time and date*/ printf(ctime(<)); /*english format output*/ printf(asctime(localtime(<)));/*tranfer to tm*/ printf(asctime(gmtime(<))); /*tranfer to Greenwich time*/ } 【程序92】 题目:时间函数举例2 1.程序分析: 2.程序源代码: /*calculate time*/ #include "time.h" #include "stdio.h" main() { time_t start,end; int i; start=time(NULL); for(i=0;i<3000;i++) { printf("\1\1\1\1\1\1\1\1\1\1\n"); } end=time(NULL); printf("\1: The different is %6.3f\n",difftime(end,start)); } 【程序93】 题目:时间函数举例3 1.程序分析: 2.程序源代码: /*calculate time*/ #include "time.h" #include "stdio.h" main() { clock_t start,end; int i; double var; start=clock(); for(i=0;ii) { printf("please input a little smaller.\n"); scanf("%d",&guess); } else { printf("please input a little bigger.\n"); scanf("%d",&guess); } } end=clock(); b=time(NULL); printf("\1: It took you %6.3f seconds\n",var=(double)(end-start)/18.2); printf("\1: it took you %6.3f seconds\n\n",difftime(b,a)); if(var<15) printf("\1\1 You are very clever! \1\1\n\n"); else if(var<25) printf("\1\1 you are normal! \1\1\n\n"); else printf("\1\1 you are stupid! \1\1\n\n"); printf("\1\1 Congradulations \1\1\n\n"); printf("The number you guess is %d",i); } printf("\ndo you want to try it again?(\"yy\".or.\"n\")\n"); if((c=getch())=='y') goto loop; } 【程序95】 题目:家庭财务管理小程序 1.程序分析: 2.程序源代码: /*money management system*/ #include "stdio.h" #include "dos.h" main() { FILE *fp; struct date d; float sum,chm=0.0; int len,i,j=0; int c; char ch[4]="",ch1[16]="",chtime[12]="",chshop[16],chmoney[8]; pp: clrscr(); sum=0.0; gotoxy(1,1);printf("|----------------------------------------------------|"); gotoxy(1,2);printf("| money management system(C1.0) 2000.03 |"); gotoxy(1,3);printf("|----------------------------------------------------|"); gotoxy(1,4);printf("| -- money records -- | -- today cost list -- |"); gotoxy(1,5);printf("| ------------------------ |-----------------------------|"); gotoxy(1,6);printf("| date: -------------- | |"); gotoxy(1,7);printf("| | | | |"); gotoxy(1,8);printf("| -------------- | |"); gotoxy(1,9);printf("| thgs: ------------------ | |"); gotoxy(1,10);printf("| | | | |"); gotoxy(1,11);printf("| ------------------ | |"); gotoxy(1,12);printf("| cost: ---------- | |"); gotoxy(1,13);printf("| | | | |"); gotoxy(1,14);printf("| ---------- | |"); gotoxy(1,15);printf("| | |"); gotoxy(1,16);printf("| | |"); gotoxy(1,17);printf("| | |"); gotoxy(1,18);printf("| | |"); gotoxy(1,19);printf("| | |"); gotoxy(1,20);printf("| | |"); gotoxy(1,21);printf("| | |"); gotoxy(1,22);printf("| | |"); gotoxy(1,23);printf("|--------------------------------------------------|"); i=0; getdate(&d); sprintf(chtime,"%4d.%02d.%02d",d.da_year,d.da_mon,d.da_day); for(;;) { gotoxy(3,24);printf(" Tab __browse cost list Esc __quit"); gotoxy(13,10);printf(" "); gotoxy(13,13);printf(" "); gotoxy(13,7);printf("%s",chtime); j=18; ch[0 ]=getch(); if(ch[0]==27) break; strcpy (chshop,""); strcpy(chmoney,""); if(ch[0]==9) { mm:i=0; fp=fopen("home.dat","r+"); gotoxy(3,24);printf(" "); gotoxy(6,4);printf(" list records "); gotoxy(1,5);printf("|-------------------------------------|"); gotoxy(41,4);printf(" "); gotoxy(41,5);printf(" |"); while(fscanf(fp,"%10s%14s%f\n",chtime,chshop,&chm)!=EOF) { if(i==36) { getch(); i=0; } if ((i%36)16) { gotoxy(41,4+i-17); printf(" "); gotoxy(42,4+i-17); } i++; sum=sum+chm; printf("%10s %-14s %6.1f\n",chtime,chshop,chm);} gotoxy(1,23);printf("|----------------------------------------------|"); gotoxy(1,24);printf("| |"); gotoxy(1,25);printf("|----------------------------------------------|"); gotoxy(10,24);printf("total is %8.1f$",sum); fclose(fp); gotoxy(49,24);printf("press any key to.....");getch();goto pp; } else { while(ch[0]!='\r') { if(j15) { len=len+1; j=11; } strcpy(ch1,""); j=j-2; strncat(ch1,chtime,len); strcpy(chtime,""); strncat(chtime,ch1,len-1); gotoxy(13,7);printf(" "); } gotoxy(13,7);printf("%s",chtime);ch[0]=getch(); if(ch[0]==9) goto mm; if(ch[0]==27) exit(1); } gotoxy(3,24);printf(" "); gotoxy(13,10); j=0; ch[0]=getch(); while(ch[0]!='\r') { if (j<14) { strncat(chshop,ch,1); j++; } if(ch[0]==8) { len=strlen(chshop)-1; strcpy(ch1,""); j=j-2; strncat(ch1,chshop,len); strcpy(chshop,""); strncat(chshop,ch1,len-1); gotoxy(13,10);printf(" "); } gotoxy(13,10);printf("%s",chshop);ch[0]=getch();} gotoxy(13,13); j=0; ch[0]=getch(); while(ch[0]!='\r') { if (j='a'&&str[i]<='z') str[i]=str[i]-32; fputc(str[i],fp); i++; } fclose(fp); fp=fopen("test","r"); fgets(str,strlen(str)+1,fp); printf("%s\n",str); fclose(fp); } 【程序99】 题目:有两个磁盘文件A和B,各存放一字母,要求把这两个文件中的信息合并(按字母顺序排列), 输出到一个新文件C中。 1.程序分析: 2.程序源代码: #include "stdio.h" main() { FILE *fp; int i,j,n,ni; char c[160],t,ch; if((fp=fopen("A","r"))==NULL) { printf("file A cannot be opened\n"); exit(0); } printf("\n A contents are :\n"); for(i=0;(ch=fgetc(fp))!=EOF;i++) { c[i]=ch; putchar(c[i]); } fclose(fp); ni=i; if((fp=fopen("B","r"))==NULL) { printf("file B cannot be opened\n"); exit(0); } printf("\n B contents are :\n"); for(i=0;(ch=fgetc(fp))!=EOF;i++) { c[i]=ch; putchar(c[i]); } fclose(fp); n=i; for(i=0;i<n;i++) for(j=i+1;jc[j]) { t=c[i];c[i]=c[j];c[j]=t; } printf("\n C file is:\n"); fp=fopen("C","w"); for(i=0;i<n;i++) { putc(c[i],fp); putchar(c[i]); } fclose(fp); } 【程序100】 题目:有五个学生,每个学生有3门课的成绩,从键盘输入以上数据(包括学生号,姓名,三门课成绩),计算出平均成绩,况原有的数据和计算出的平均分数存放在磁盘文件"stud"中。 1.程序分析: 2.程序源代码: #include "stdio.h" struct student { char num[6]; char name[8]; int score[3]; float avr; } stu[5]; main() { int i,j,sum; FILE *fp; /*input*/ for(i=0;i<5;i++) { printf("\n please input No. %d score:\n",i); printf("stuNo:"); scanf("%s",stu[i].num); printf("name:"); scanf("%s",stu[i].name); sum=0; for(j=0;j<3;j++) { printf("score %d.",j+1); scanf("%d",&stu[i].score[j]); sum+=stu[i].score[j]; } stu[i].avr=sum/3.0; } fp=fopen("stud","w"); for(i=0;i<5;i++) if(fwrite(&stu[i],sizeof(struct student),1,fp)!=1) printf("file write error\n"); fclose(fp); }
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值