python语法分析器（parser）源码阅读（一）

最新推荐文章于 2021-11-16 16:53:24 发布

原创最新推荐文章于 2021-11-16 16:53:24 发布 · 1.8k 阅读

·

6

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#python #编译器

python编译器专栏收录该内容

3 篇文章

订阅专栏

博主分享了对Python 3.7.9解析器源代码的初步探索，源码主要包括parser和tokenizer两个部分，涉及语法分析、词法分析、数据结构等。通过分析《编译原理》中的概念，如FIRST集和加速模块，博主计划自顶向下逐步解读各个源文件的功能。结构图展示了文件间的依赖关系，为后续深入研究打下基础。

从官方网站上下载了python3.7.9的源代码，准备这几天看一下python的语法分析器。

本来我以为会有很多东西，没想到打开了parser这个文件夹之后，发现才有14个文件（c语言的文件），其中有2个头文件，12个源文件。

注：阅读这一部分的源码，搭配《编译原理》更佳。

我准备从自顶向下的顺序进行分析：

文件包含关系

1.头文件

parser.h 定义了几个语法分析器有关的数据结构，以栈的形式存储语法分析器
tokenizer.h 里面主要写了一个结构体tok_state ，记录着源代码（你写的python代码）的很多东西

2.源文件

acceler.c 语法分析器加速模块
bitset.c 被解析器使用的bitset原语
firstsets.c FIRST集的代码实现(详见《编译原理》4.4.2)
grammar.c 语法实现
grammar1.c 被parser所需要的语法子程序
listnode.c 在文件(stdout，即输出)中列举一些节点
metagrammar.c 定义了一堆变量，暂没看懂啥意思。
myreadline.c 获取输入的地方，调用的ReadConsoleW这个API来获取输入
node.c 语法分析树节点实现
parser.c 语法分析器实现
parsetok.c 语法分析与词法分析的沟通桥梁
tokenizer.c 词法分析器

有些文件解释的不是很理想，但是并无伤大雅，接下来我会更深入的分析里面的函数与数据结构。

接下来供上结构图，仅包含parser中的文件。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。