编译原理实验一-词法分析器

本文介绍了一个词法分析程序的设计与实现,旨在帮助读者理解如何从源代码中识别出具有独立意义的单词,并将其分类为标识符、关键字、常数、运算符和分隔符等类别。文章详细展示了代码实现过程,包括状态转换图、关键函数定义等。

一、实验目的

实验目的和要求 通过编写词法分析程序,熟悉其识别单词的基本思想及构造方法。

二、实验要求

编制一个读单词过程,从输入的源程序中,识别出各个具有独立意义的单词,即基本保留字、标识符、常数、运算符、分隔符五大类。并依次输出各个单词的内部编码、单词 符号自身值、字符类型。(遇到错误时可显示“Error”,并输出该字符,然后跳过该字符继续识别)。
(1) 标识符(变量)
ID=letter(letter|digit)*

(2) 关键字
void,main,short,long,int,double,float,while,if,else,for,break,return,char

(1) 实数
整数或小数

(2) 运算符
加减乘除 以及 < <= == > >=

(3) 分隔符

, ; ( ) { }

部分状态转换图

在这里插入图片描述

代码实现

#include <iostream>
#include <fstream>
#include <string>
#include<map>
#include <cstdio>
#include <cstdlib>
#define SIZE(a)(sizeof(a)/sizeof(a[0])) //求元素个数
using namespace std;
char op[] = {'+','-','*','/'};
void set_mp(map<int,string>&mp) {
    mp[1] = "标识符";
    mp[2] = "关键字";
    mp[3] = "运算符";
    mp[4] = "分隔符";
    mp[5] = "整数";
    mp[6] = "小数";

}
int find_k(string s){//查找s是否在保留字表keyword中
    string keyword[] = {"void","main","short","long","int","double","float","while","if","else","for","break","return","char" };//keyword表
    for (int i = 0; i < SIZE(keyword); i++) {
        if (s.compare(keyword[i]) == 0)return 1;//是保留字,返回1
    }
    return 0;//不是保留字,返回0
}

int isLimit(char c) {
    if (c == ',' || c == ';' || c == '(' || c == ')' || c == '{' || c == '}') {//识别分界符 4
            return 1;
        }
        return 0;
}

int isOp(char c) {
    int p = -1;
    for(int i = 0; i < 4; i++) {
        if(c == op[i]) p = i;
    }
    return p;
}

int main()
{
    ifstream in("input.txt");
    ofstream out("output.txt");
    string s;
    char word;
    int op_pos = -1;
    map<int,string>mp;
    set_mp(mp);
    word = in.get();

    while (!in.eof()) {
        if (isLimit(word)) {//识别分界符
            out << "<" << word << ",4,"<<mp[4]<<">\n";
            word = in.get();
        }else if (isdigit(word)) {//识别整数/实数
            s = "";
            while (isdigit(word)) {
                s += word;
                word = in.get();
                if (word == '.') {//如果出现小数点,有可能是常实数
                    s += word;
                    word = in.get();
                    if (isdigit(word)) {
                        while (isdigit(word)) {
                            s += word;
                            word = in.get();
                        }
                        out << "<" << s << ",6,"<<mp[6]<<">\n";//常实数
                        break;
                    }
                    else out << s + " is error!\n";//如果小数点后没有数字,则报错
                }
                if (!isdigit(word)) {
                    out << "<" << s << ",5,"<<mp[5]<<">\n";//常整数
                    break;
                }
            }
        }else if (isalpha(word) || word == '_') {//识别标识符/保留字
            s = "";
            while (isalpha(word) || isdigit(word) || word =='_') {
                s += word;
                word = in.get();
            }
            if (find_k(s)) {//在keyword表中查找s是否是保留字
                out << "<" << s << ",2,"<<mp[2]<<">\n";//保留字
            }
            else out << "<" << s << ",1,"<<mp[1]<<">\n";//标识符
        }else if (word == '>') {//后面都是运算符
            s = "";
            s += word;
            word = in.get();
            if (word == '=') {//">="
                s += word;
                word = in.get();
            }
            out << "<" << s << ",3,"<<mp[3]<<">\n";
        }
        else if (word == '<') {
            s = "";
            s += word;
            word = in.get();
            if (word == '=') {//"<="
                s += word;
                word = in.get();
            }
            out << "<" << s << ",3,"<<mp[3]<<">\n";
        }else if (word == '=') {
            s = "";
            s += word;
            word = in.get();
            if (word == '=') {//"=="
                s += word;
                word = in.get();
            }
            out << "<" << s << ",3,"<<mp[3]<<">\n";
        }else if((op_pos = isOp(word)) != -1) {
            out << "<" << word << ",3,"<<mp[3]<<">\n";
            word = in.get();
        }else {//跳过当前单词
            word = in.get();
        }
    }
    return 0;
}

测试数据

int main()
{
   int i,ans;
   char c;
   scan c;
   double b=1.5;
   float f;
   for(i=0;i<5;i=i+1)
   {
       ans=ans+1;
   }
   print ans;
   return 0;
}

输出结果

<int,2,关键字>
<main,2,关键字>
<(,4,分隔符>
<),4,分隔符>
<{,4,分隔符>
<int,2,关键字>
<i,1,标识符>
<,,4,分隔符>
<ans,1,标识符>
<;,4,分隔符>
<char,2,关键字>
<c,1,标识符>
<;,4,分隔符>
<scan,1,标识符>
<c,1,标识符>
<;,4,分隔符>
<double,2,关键字>
<b,1,标识符>
<=,3,运算符>
<1.5,6,小数>
<;,4,分隔符>
<float,2,关键字>
<f,1,标识符>
<;,4,分隔符>
<for,2,关键字>
<(,4,分隔符>
<i,1,标识符>
<=,3,运算符>
<0,5,整数>
<;,4,分隔符>
<i,1,标识符>
<<,3,运算符>
<5,5,整数>
<;,4,分隔符>
<i,1,标识符>
<=,3,运算符>
<i,1,标识符>
<1,5,整数>
<),4,分隔符>
<{,4,分隔符>
<ans,1,标识符>
<=,3,运算符>
<ans,1,标识符>
<1,5,整数>
<;,4,分隔符>
<},4,分隔符>
<print,1,标识符>
<ans,1,标识符>
<;,4,分隔符>
<return,2,关键字>
<0,5,整数>
<;,4,分隔符>
<},4,分隔符>

实验词法分析 实验目的 通过设计一个具体的词法分析程序,加深对词法分析原理的理解。并掌握在对程序设计语言源程序进行扫描过程中将其分解为各类单词词法分析方法。 编制一个单词过程,从输入源程序中,识别各个具有独立意义单词,即基本保留字、标识符、常数、运算符、分隔符五大类。并依次输各个单词的内部编码及单词符号自身值。 二、实验预习提示 1、 词法分析器的功能和输格式 词法分析器的功能是输入源程序,输单词符号。词法分析器单词符号常常表示成以下的二元式(单词种别码,单词符号的属性值)。本实验中,采用的是类符号对应一个种别码的方式。 2、 单词的BNF表示 ----> ----> ----> + ----> - 等等 3、 模块结构(见课本P95-96)(可根据自己的理解适当修改) 三、实验过程和指导: () 准备: 1. 阅课本有关章节,明确语言的语法,写基本保留字、标识符、常数、运算符、分隔符和程序例。 2. 初步编制好程序。 3. 准备好多组测试数据。 (二) 上机: (三) 程序要求: 1. 要求用C++Builder或者Dephi或者VC、VB等可视化编程工具编写;要求有界面(即般windows下应用程序界面)。 2. 输入为某语言源代码。 程序输入/输示例: 如源程序为C语言输入如下段: main() { int a,b; a=10; b=a+20; } 要求输如下(并以文件形式输)。 (2,”main”) (5,”(“) (5,”)“) (5,”{“} (1,”int”) (2,”a”) (5,”,”) (2,”b”) (5,”;”) (2,”a”) (4,”=”) (3,”10”) (5,”;”) (2,”b”) (4,”=”) (2,”a”) (4,”+”) (3,”20”) (5,”;”) (5,”}“) 注:为右大括号 要求(可根据实际情况加以扩充和修改): 识别保留字:if、int、for、while、do、return、break、continue等等,单词种别码为1。 其他的标识符,单词种别码为2。 常数为无符号数,单词种别码为3。 运算符包括:+、-、*、/、=、>、=、<=、!= ;单词种别码为4。 分隔符包括: “,”“;”“(”“)”“{”“}”等等, 单词种别码为5。 (四) 程序思路(仅供参考): 0. 定义部分:定义常量、变量、数据结构。 1. 初始化:从文件将源程序输入到字符缓冲区中。 2. 取单词前:去掉多余空白。调用过程GETNB(); 3. 提取字符组成单词,利用课本P97图4.5转换图构造单词扫描过程SCAN(),需要根据实际情况加以修改。 4. 判断单词的种别码,调用过程LOOKUP(); 5. 显示(导)结果。
此资源包含源代码和实验报告。 实验目的 设计、编制、调试一个词法分析子程序-识别单词,加深对词法分析原理的理解。通过本实验的编程实践,使学生了解词法分析的任务,掌握词法分析程序设计的原理和构造方法,使学生对编译的基本概念、原理和方法有完整的和清楚的理解,并能正确地、熟练地运用。 二、实验要求 该程序要实现的是一个单词过程,从输入源程序中,识别各个具有独立意义单词,即关键字、标识符、数据、运算符、分界符等五大类,并依次输各个单词的种类及单词符号自身值。若遇到错误则显示“Error”,然后跳过错误部分继续显示 。 三、实验内容 通过输入源程序从左到右对字符串进行扫描和分解,依次输各个单词的内部编码及单词符号自身值;若遇到错误则显示“Error”,然后跳过错误部分继续显示。 以下是实现词法分析设计的主要工作: (1)从源程序文件中入字符。 (2)删除空格类字符,包括回车、制表符空格。 (3)按拼写单词,并用(单词,属性)二元式表示。 (4)如果发现错误则报告错。 单词基本分类: 关键字:由程序语言定义的具有固定意义的标识符。也称为保留字例如 i f、const; 单词种别码为1。 标识符:用以表示各种名字,如变量名、数组名、函数名;种别码为2。 数据: 任何数值常数。如 125,3.14等;种别码为3。 运算符:+、-、*、/、<、、>=、;种别码为4。 分界符: ; 、, 、(、) 、[、];种别码为5。 Error:#、%等。
评论 1
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值