2、Ruby代码的分词与解析：深入探究

最新推荐文章于 2025-07-28 15:57:13 发布

git9versioner

最新推荐文章于 2025-07-28 15:57:13 发布

阅读量28

点赞数

CC 4.0 BY-SA版权

分类专栏：《Ruby显微镜下》：探索Ruby内部机制文章标签： Ruby分词 Ripper 解析机制

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/git9versioner/article/details/149609981

《Ruby显微镜下》：探索Ruby内部机制专栏收录该内容

26 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

Ruby代码的分词与解析：深入探究

1. Ruby分词机制

在Ruby中，若你熟悉C语言且想深入了解Ruby对代码文件进行分词的详细过程，可查看Ruby版本中的 parse.y 文件。 .y 扩展名表明 parse.y 是一个语法规则文件，包含了Ruby解析引擎的一系列规则。该文件极其庞大复杂，代码行数超10000行。

暂时忽略语法规则，在文件约三分之二处（约第6500行），可找到名为 parser_yylex 的C函数，它包含了实际对代码进行分词的代码。仔细查看，会发现一个大型 switch 语句，起始代码如下：

u retry:
v last_state = lex_state;
w switch (c = nextc()) {

nextc() 函数返回代码文件文本流中的下一个字符，可将其视为之前图表中的箭头。 lex_state 变量保存着Ruby当前正在处理的代码状态或类型信息。

大型 switch 语句会检查代码文件的每个字符，并根据字符内容采取不同操作。例如，以下代码用于查找空白字符并忽略它们：

/* white spaces */
case ' ': case '\t': case '\f': case '\r':
case '\13': /* '\v' */

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。