小C语言--词法分析程序

本文围绕小C语言词法分析程序展开,给出小C语言文法,要对源程序进行词法分析,识别关键字、自定义标识符、整数、界符和运算符。介绍了输入输出要求,给出思路,即利用空格、回车、界符和运算符分割字符串并分析,最后附上了实现该功能的代码。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

小C语言--词法分析程序

Time Limit: 1000 ms Memory Limit: 65535 KiB

Submit Statistic

Problem Description

小C语言文法 
1. <程序>→(){<声明序列><语句序列>}
2. <声明序列>→<声明序列><声明语句>|<声明语句>|<空>
3. <声明语句>→<标识符表>;
4. <标识符表>→<标识符>,<标识符表>|<标识符>
5. <语句序列>→<语句序列><语句>|<语句>
6. <语句>→< if语句>|< while语句>|< for语句>|<复合语句>|<赋值语句>
7. < if语句>→< if关键字>(<表达式>)<复合语句>|(<表达式>)<复合语句>< else关键字><复合语句>
8. < while语句>→< while关键字>(<表达式>)<复合语句>
9. < for语句>→< for关键字>(<表达式>;<表达式>;<表达式>)<复合语句>
10. <复合语句>→{<语句序列>}
11. <赋值语句>→<表达式>;
12. <表达式>→<标识符>=<算数表达式>|<布尔表达式>
13. <布尔表达式>→<算数表达式> |<算数表达式><关系运算符><算数表达式>
14. <关系运算符>→>|<|>=|<=|==|!=
15. <算数表达式>→<算数表达式>+<项>|<算数表达式>-<项>|<项>
16. <项>→<项>*<因子>|<项>/<因子>|<因子>
17. <因子>→<标识符>|<无符号整数>|(<算数表达式>)
18. <标识符>→<字母>|<标识符><字母>|<标识符><数字>
19. <无符号整数>→<数字>|<无符号整数><数字>
20. <字母>→a|b|…|z|A|B|…|Z
21. <数字>→0|1|2|3|4|5|6|7|8|9

22. < main关键字>→main
23. < if关键字>→if
24. < else关键字>→else
25. < for关键字>→for
26. < while关键字>→while
27. < int关键字>→int

 

每行单词数不超过10个
小C语言文法如上,现在我们对小C语言写的一个源程序进行词法分析,分析出关键字、自定义标识符、整数、界符
和运算符。
关键字:main if else for while int
自定义标识符:除关键字外的标识符
整数:无符号整数
界符:{ } ( ) , ;
运算符:= + - * / < <= > >= == !=

Input

输入一个小C语言源程序,源程序长度不超过2000个字符,保证输入合法。

Output

按照源程序中单词出现顺序输出,输出二元组形式的单词串。

(单词种类,单词值)

单词一共5个种类:

关键字:用keyword表示
自定义标识符:用identifier表示
整数:用integer表示
界符:用boundary表示
运算符:用operator表示

每种单词值用该单词的符号串表示。

Sample Input

main() 
{
    int a, b;
    if(a == 10)
    {
        a = b;
    }
}

Sample Output

(keyword,main)
(boundary,()
(boundary,))
(boundary,{)
(keyword,int)
(identifier,a)
(boundary,,)
(identifier,b)
(boundary,;)
(keyword,if)
(boundary,()
(identifier,a)
(operator,==)
(integer,10)
(boundary,))
(boundary,{)
(identifier,a)
(operator,=)
(identifier,b)
(boundary,;)
(boundary,})
(boundary,})

Hint

Source

cai++

思路:使用空格,回车,界符和运算符分割字符串,然后对字符串进行分析(分析是整数,关键字,自定义标识符三者中的哪一种)

(1)空格,回车:利用cin的性质

(2)界符和运算符:利用temp数组

注意:数字+字母的形式(如:123abc)不属于题干中单词的5种分类的任何一种(文法中的18和19条表明整数只能由数字组成,而自定义标识符一定是标识符,标识符必须以字母开头),但提交发现将这种形式归为自定义标识符可以AC,就没有细分

代码:

#include <iostream>
#include <string.h>
#include <cstdio>

using namespace std;

char key[][6]={"main","if","else","for","while","int"};//列下标不能缺省

void f(char temp[])
{
    if(temp[0]>='0'&& temp[0]<='9')
    {
        cout<<"(integer,"<<temp<<")"<<endl;
    }
    else
    {
        for(int i=0;i<6;i++)
        {
            if(!strcmp(temp,key[i]))
            {
                cout<<"(keyword,"<<temp<<")"<<endl;
                return;
            }
        }
        cout<<"(identifier,"<<temp<<")"<<endl;
    }
}

int main()
{
    char code[2020]={0};
    char temp[2020]={0};//char数组要初始化,否则会有乱码
    while(cin>>code)
    {
        for(int i=0;i<strlen(code);i++)
        {
            char x=code[i];
            if(x=='{'||x=='}'||x=='('||x==')'||x==','||x==';')
            {
                if(strlen(temp))
                {
                    f(temp);
                    memset(temp,'\0',sizeof(temp));
                }
                cout<<"(boundary,"<<x<<")"<<endl;
            }
            else if(x=='+'||x=='-'||x=='*'||x=='/')
            {
                if(strlen(temp))
                {
                    f(temp);
                    memset(temp,'\0',sizeof(temp));
                }
                cout<<"(operator,"<<x<<")"<<endl;
            }
            else if(x=='>'||x=='<'||x=='='||x=='!')//这里把!也作为运算符(虽然OJ上并没有说明)
            {
                if(strlen(temp))
                {
                    f(temp);
                    memset(temp,'\0',sizeof(temp));
                }
                if(i+1<strlen(code) && code[i+1]=='=')
                {
                    cout<<"(operator,"<<x<<"=)"<<endl;
                    i++;
                }
                else
                {
                    cout<<"(operator,"<<x<<")"<<endl;
                }
            }
            else
            {
                temp[strlen(temp)]=x;
            }
        }
        if(strlen(temp))
        {
            f(temp);
            memset(temp,'\0',sizeof(temp));
        }
    }
    return 0;
}
 

小C语言词法分析程序主要用于对源程序进行分析,将源程序中的各种单词进行分类提取。根据引用和引用中提供的信息,词法分析程序可以将源程序中的关键字、自定义标识符、整数、界符和运算符进行分析和提取。 关键字包括main、if、else、for、while和int等。自定义标识符是除了关键字之外的标识符。整数是无符号的整数。界符包括大括号{}、小括号()、逗号,和分号;。运算符包括等号=、减号-、乘号*、除号/、小于号<、左移运算符<<、大于等于>=、等于==和不等于!=等。 在编写词法分析程序时,可以使用字符串处理函数,例如gets、strcpy和strcmp等,来从键盘获取源程序输入,并对字符串进行复制和比较操作,以便进行单词的分类和提取。 通过词法分析程序,可以将源程序中的各种单词按照其类型进行分类,并提取出来,从而为后续的语法分析和语义分析提供基础。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* [小C语言--词法分析程序](https://blog.csdn.net/wq3699823668/article/details/100599572)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 33.333333333333336%"] - *2* [A - 小C语言--词法分析程序](https://blog.csdn.net/Mercury_Lc/article/details/108685127)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 33.333333333333336%"] - *3* [词法分析程序(c语言编写)](https://download.csdn.net/download/wviyong/1797051)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 33.333333333333336%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值