小C语言--词法分析程序
Problem Description
小C语言文法
1. <程序>→(){<声明序列><语句序列>}
2. <声明序列>→<声明序列><声明语句>|<声明语句>|<空>
3. <声明语句>→<标识符表>;
4. <标识符表>→<标识符>,<标识符表>|<标识符>
5. <语句序列>→<语句序列><语句>|<语句>
6. <语句>→< if语句>|< while语句>|< for语句>|<复合语句>|<赋值语句>
7. < if语句>→< if关键字>(<表达式>)<复合语句>|(<表达式>)<复合语句>< else关键字><复合语句>
8. < while语句>→< while关键字>(<表达式>)<复合语句>
9. < for语句>→< for关键字>(<表达式>;<表达式>;<表达式>)<复合语句>
10. <复合语句>→{<语句序列>}
11. <赋值语句>→<表达式>;
12. <表达式>→<标识符>=<算数表达式>|<布尔表达式>
13. <布尔表达式>→<算数表达式> |<算数表达式><关系运算符><算数表达式>
14. <关系运算符>→>|<|>=|<=|==|!=
15. <算数表达式>→<算数表达式>+<项>|<算数表达式>-<项>|<项>
16. <项>→<项>*<因子>|<项>/<因子>|<因子>
17. <因子>→<标识符>|<无符号整数>|(<算数表达式>)
18. <标识符>→<字母>|<标识符><字母>|<标识符><数字>
19. <无符号整数>→<数字>|<无符号整数><数字>
20. <字母>→a|b|…|z|A|B|…|Z
21. <数字>→0|1|2|3|4|5|6|7|8|9
22. < main关键字>→main
23. < if关键字>→if
24. < else关键字>→else
25. < for关键字>→for
26. < while关键字>→while
27. < int关键字>→int
小C语言文法如上,现在我们对小C语言写的一个源程序进行词法分析,分析出关键字、自定义标识符、整数、界符
和运算符。
关键字:main if else for while int
自定义标识符:除关键字外的标识符
整数:无符号整数
界符:{ } ( ) , ;
运算符:= + - * / < <= > >= == !=
Input
输入一个小C语言源程序,源程序长度不超过2000个字符,保证输入合法。
Output
按照源程序中单词出现顺序输出,输出二元组形式的单词串。
(单词种类,单词值)
单词一共5个种类:
关键字:用keyword表示
自定义标识符:用identifier表示
整数:用integer表示
界符:用boundary表示
运算符:用operator表示
每种单词值用该单词的符号串表示。
Example Input
main() { int a, b; if(a == 10) { a = b; } }
Example Output
(keyword,main) (boundary,() (boundary,)) (boundary,{) (keyword,int) (identifier,a) (boundary,,) (identifier,b) (boundary,;) (keyword,if) (boundary,() (identifier,a) (operator,==) (integer,10) (boundary,)) (boundary,{) (identifier,a) (operator,=) (identifier,b) (boundary,;) (boundary,}) (boundary,})
Hint
Author
#include<stdio.h>
#include<string.h>
char Word[1000];
int p;
int is_digit(char c)//判断是否是数字
{
if(c>='0'&&c<='9')return 1;
else return 0;
}
int is_letter(char c)//判断是否是字母
{
if(c>='a'&&c<='z'||c>='A'&&c<='Z')return 1;
else return 0;
}
int is_keyword()//判断是否是关键字
{
if(!strcmp(Word,"main")||!strcmp(Word,"while")||!strcmp(Word,"if")||!strcmp(Word,"else")||
!strcmp(Word,"for")||!strcmp(Word,"int"))return 1;
else return 0;
}
void is_identifier()//判断是否是标识符
{
char c;
while(~scanf("%c",&c))
{
if(is_letter(c)||is_digit(c))
{
Word[++p]=c;
}
else
{
ungetc(c,stdin);
break;
}
}
if(is_keyword())printf("(keyword,%s)\n",Word);
else printf("(identifier,%s)\n",Word);
}
void is_integer()//判读是否是整数
{
char c;
while(~scanf("%c",&c))
{
if(is_digit(c))
{
Word[++p]=c;
}
else
{
ungetc(c,stdin);//把读取的字符回退
break;
}
}
printf("(integer,%s)\n",Word);
}
void is_boundary()
{
printf("(boundary,%s)\n",Word);
}
void get()
{
char c,temp;
while(~scanf("%c",&c)){
if(c==' '||c=='\n')continue;
p=-1;
Word[++p]=c;
switch(c)
{
case'a':case'b':case'c':case'd':case'e':case 'f':
case'g':case'h':case'i':case'j':case'k':case 'l':
case'm':case'n':case'o':case'p':case'q':case 'r':
case's':case't':case'u':case'v':case'w':case'x':
case'y':case'z':
case'A':case'B':case'C':case'D':case 'E':case 'F':
case'G':case'H':case'I':case'J':case 'K':case 'L':
case'M':case'N':case'O':case'P':case 'Q':case 'R':
case'S':case'T':case'U':case'V':case 'W':case 'X':
case'Y':case'Z':
is_identifier();
break;
case'1':case '2':case '3':case '4':case '5':
case '6':case '7':case '8':case '9':case '0':
is_integer();
break;
case '{':case '}':case '(':case ')':case ',':case ';':
is_boundary();
break;
case '=':
scanf("%c",&temp);
if(temp=='=')
printf("(operator,==)\n");
else
{
printf("(operator,=)\n");
ungetc(temp,stdin);
}
break;
case '+':
printf("(operator,+)\n");break;
case '-':
printf("(operator,-)\n");break;
case '*':
printf("(operator,*)\n");break;
case '/':
printf("(operator,/)\n");break;
case '<':
scanf("%c",&temp);
if(temp=='=')
printf("(operator,<=)\n");
else
{
printf("(operator,<)\n");
ungetc(temp,stdin);
}
break;
case '>':
scanf("%c",&temp);
if(temp=='=')
printf("(operator,>=)\n");
else
{
printf("(operator,>)\n");
ungetc(temp,stdin);
}
break;
case '!':
scanf("%c",&temp);
if(temp=='=')
printf("(operator,!=)\n");
else
{
printf("(operator,!)\n");
ungetc(temp,stdin);
}
break;
}
p=-1;
memset(Word,0,sizeof(Word));
}
}
int main()
{
get();
}