状态机学习(四)解析四则运算式 词法分析

本文介绍了一个简单的词法分析器的实现过程,该分析器能够从输入字符串中识别出数字和算术运算符等词法单元,并通过枚举和结构体的方式定义了不同的词法单元类型。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

#include <string>
#include <iostream>
using namespace std;

char* testStr = "12+345-6*8/9";

typedef enum {
BAD_TOKEN,
NUMBER_TOKEN,
ADD_OPERATOR_TOKEN,
SUB_OPERATOR_TOKEN,
MUL_OPERATOR_TOKEN,
DIV_OPERATOR_TOKEN,
END_OF_LINE_TOKEN
} TokenKind;

typedef struct {
TokenKind kind;
unsigned value;
string s;
} Token;

typedef enum {
INITIAL_STATUS,
IN_INT_PART_STATUS
} LexerStatus;
//==========================================

static size_t gParseIndex = 0;

bool GetToken(Token& token,const string& strContent) {
LexerStatus status = INITIAL_STATUS;
token.kind = BAD_TOKEN;
char currentChar = '\0';
size_t numBegIndex = 0;
size_t numEndIndex = 0;
while (gParseIndex < strContent.size())
{
//数字状态跳出
if(status == IN_INT_PART_STATUS &&
!isdigit(strContent[gParseIndex]) ) {
numEndIndex = gParseIndex;
token.kind = NUMBER_TOKEN;
token.s = strContent.substr(numBegIndex, numEndIndex- numBegIndex);
return true;
}
// 空格略过 换行结束函数
if (isspace(strContent[gParseIndex])) {
if (strContent[gParseIndex] == '\r' ||
strContent[gParseIndex] == '\n') {
token.kind = END_OF_LINE_TOKEN;
return true;
}
else {
gParseIndex++;
continue;
}
}

if (isdigit(strContent[gParseIndex])) {
if (status != IN_INT_PART_STATUS) {
status = IN_INT_PART_STATUS;
numBegIndex = gParseIndex;
}
gParseIndex++;
continue;
}

if (strContent[gParseIndex] == '+') {
token.kind = ADD_OPERATOR_TOKEN;
token.s = strContent[gParseIndex];
gParseIndex++;
return true;
}
else if (strContent[gParseIndex] == '-') {
token.kind = SUB_OPERATOR_TOKEN;
token.s = strContent[gParseIndex];
gParseIndex++;
return true;
}
else if (strContent[gParseIndex] == '*') {
token.kind = MUL_OPERATOR_TOKEN;
token.s = strContent[gParseIndex];
gParseIndex++;
return true;
}
else if (strContent[gParseIndex] == '/') {
token.kind = DIV_OPERATOR_TOKEN;
token.s = strContent[gParseIndex];
gParseIndex++;
return true;
}

cerr << "Parse Error " << endl;
token.kind = BAD_TOKEN;
return false;
}
// 最后结尾 检查是否数字字符串状态需要跳出
if (status == IN_INT_PART_STATUS &&
gParseIndex == strContent.size()) {
numEndIndex = gParseIndex;
token.kind = NUMBER_TOKEN;
token.s = strContent.substr(numBegIndex, numEndIndex - numBegIndex);
return true;
}

token.kind = END_OF_LINE_TOKEN;
return true;
}

#define TEST_MACRO
#ifdef TEST_MACRO


void ParseLinetest(string s) {
Token token;
gParseIndex = 0;
while (1) {
if (GetToken(token, s)) {
if (token.kind == END_OF_LINE_TOKEN) {
break;
}
else {
cout << "kind = " << token.kind
<< ", str = " << token.s << endl;
}
}

}
}


int main()
{
ParseLinetest(testStr);
return 0;
}

 

转载于:https://www.cnblogs.com/itdef/p/6159808.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值