编译原理之标识符拆分


#pragma once
#include<string>
#include<cctype>
#include <unordered_set>

using namespace std;

const unordered_set<string> keywords({
	"auto", "short", "int", "long", "float", "double",
	"char", "struct", "union", "enum", "typedef", "const",
	"unsigned", "signed", "extern", "register", "static",
	"volatile", "void", "if", "else", "switch", "for",
	"do", "while", "goto", "continue", "break", "default",
	"sizeof", "return"
});
#define iskey(ch) (keywords.count(ch))

const unordered_set<char> operators({
	'+', '-', '*' , '/', '%', '=',
	'!', '~', '&', '|', '(', ')',
	';', '>', '<'
});
#define isoper(ch) (operators.count(ch))

enum TokenType {
	KEY, ID, NUM, OP, OTH, NONE
};

class Tokenizer {
	string stmt;
	int idx;

public:
	Tokenizer() : idx(0) {}
	Tokenizer(string& _stmt) : stmt(_stmt), idx(0) {}

	void consume(string & _stmt) {
		stmt.swap(_stmt);
	}

	TokenType next(string& token);
	
	void reset() {
		idx = 0;
	}
};





#include "Tokenizer.h"

TokenType Tokenizer::next(string& token)
{
	token.clear();
	int cnt = 0;

	// skip spaces
	while (idx < stmt.length() && isspace(stmt[idx]))
		++idx;

	// parse token
	while (idx < stmt.length()) {
		// id
		if (isalpha(stmt[idx]) || stmt[idx] == '_') {
			size_t idx2 = idx;
			while (isalnum(stmt[idx]) || stmt[idx] == '_')
				if (++idx >= stmt.length())
					break;
			token.append(stmt.substr(idx2, idx - idx2));

			// check boundary
			if (!isspace(stmt[idx]) && !isoper(stmt[idx]))
				break;

			// check keywords
			if (iskey(token))
				return KEY;

			return ID;
		}

		// num
		else if (isalnum(stmt[idx]) && !isalpha(stmt[idx]) || stmt[idx] == '.') {
			// read hex preffix
			if (stmt[idx] == '0' && idx + 1 < stmt.length() && stmt[idx + 1] == 'x') {
				token.append(stmt.substr(idx, 2));
				idx += 2;
			}

			// read num and fp
			size_t idx2 = idx;
			while (isalnum(stmt[idx]) && !isalpha(stmt[idx]) || stmt[idx] == '.') {
				if (++idx >= stmt.length())
					break;
			}
			token.append(stmt.substr(idx2, idx - idx2));

			idx2 = idx;
			if (idx < stmt.length()) {
				// read suffix
			}

			// check boundary
			if (!isspace(stmt[idx]) && !isoper(stmt[idx]))
				break;

			return NUM;
		}

		// op 
		else if (isoper(stmt[idx])) {
			if (stmt[idx] == '+') {
				if (idx + 1 < stmt.length() && (stmt[idx + 1] == '+' || stmt[idx + 1] == '=')) {
					token.append(stmt.substr(idx, 2));
					idx += 2;
				}
				else
					token.append(1, stmt[idx++]);
			}
			else  if (stmt[idx] == '-') {
				if (idx + 1 < stmt.length() && (stmt[idx + 1] == '-' || stmt[idx + 1] == '=')) {
					token.append(stmt.substr(idx, 2));
					idx += 2;
				}
				else
					token.append(1, stmt[idx++]);
			}
			else if (stmt[idx] == '*' || stmt[idx] == '/' || stmt[idx] == '%'
				|| stmt[idx] == '&' || stmt[idx] == '|'
				|| stmt[idx] == '~' || stmt[idx] == '!' || stmt[idx] == '=') {
				if (idx + 1 < stmt.length() && stmt[idx + 1] == '=') {
					token.append(stmt.substr(idx, 2));
					idx += 2;
				}
				else
					token.append(1, stmt[idx++]);
			}
			else if (stmt[idx] == '>') {
				if (idx + 1 < stmt.length() && (stmt[idx + 1] == '>' || stmt[idx] == '=')) {
					token.append(stmt.substr(idx, 2));
					idx += 2;
				}
				else
					token.append(1, stmt[idx++]);
			}
			else if (stmt[idx] == '<') {
				if (idx + 1 < stmt.length() && (stmt[idx + 1] == '<' || stmt[idx] == '=')) {
					token.append(stmt.substr(idx, 2));
					idx += 2;
				}
				else
					token.append(1, stmt[idx++]);
			}
			else 	// ;, (, )
				token.append(1, stmt[idx++]);

			return OP;
		}

		// others
		else
			break;
	}

	// handle others
	int idx2 = idx;
	while (idx < stmt.length() && !isoper(stmt[idx]) && !isspace(stmt[idx]))
		++idx;
	token.append(stmt.substr(idx2, idx - idx2));

	if (token.empty())
		return NONE;
	else
		return OTH;
}




### 解决PyCharm无法加载Conda虚拟环境的方法 #### 配置设置 为了使 PyCharm 能够成功识别并使用 Conda 创建的虚拟环境,需确保 Anaconda 的路径已正确添加至系统的环境变量中[^1]。这一步骤至关重要,因为只有当 Python 解释器及其关联工具被加入 PATH 后,IDE 才能顺利找到它们。 对于 Windows 用户而言,在安装 Anaconda 时,默认情况下会询问是否将它添加到系统路径里;如果当时选择了否,则现在应该手动完成此操作。具体做法是在“高级系统设置”的“环境变量”选项内编辑 `Path` 变量,追加 Anaconda 安装目录下的 Scripts 文件夹位置。 另外,建议每次新建项目前都通过命令行先激活目标 conda env: ```bash conda activate myenvname ``` 接着再启动 IDE 进入工作区,这样有助于减少兼容性方面的问题发生概率。 #### 常见错误及修复方法 ##### 错误一:未发现任何解释器 症状表现为打开 PyCharm 新建工程向导页面找不到由 Conda 构建出来的 interpreter 列表项。此时应前往 Preferences/Settings -> Project:...->Python Interpreter 下方点击齿轮图标选择 Add...按钮来指定自定义的位置。按照提示浏览定位到对应版本 python.exe 的绝对地址即可解决问题。 ##### 错误二:权限不足导致 DLL 加载失败 有时即使指定了正确的解释器路径,仍可能遇到由于缺乏适当的操作系统级许可而引发的功能缺失现象。特别是涉及到调用某些特定类型的动态链接库 (Dynamic Link Library, .dll) 时尤为明显。因此拥有管理员身份执行相关动作显得尤为重要——无论是从终端还是图形界面触发创建新 venv 流程均如此处理能够有效规避此类隐患。 ##### 错误三:网络连接异常引起依赖下载超时 部分开发者反馈过因网速慢或者其他因素造成 pip install 操作中途断开进而影响整个项目的初始化进度条卡住的情况。对此可尝试调整镜像源加速获取速度或是离线模式预先准备好所需资源包后再继续后续步骤。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值