推荐(免费):PHP7
一、PHP7语言执行原理
常用的高级语言有很多种,根据运行的方式不同,大体分为两种:编译型语言和解释型语言。
编译是指在应用源程序执行之前,就将程序源代码“翻译”成汇编语言,然后进一步根据软硬件环境编译成目标文件。一般称完成编译工作的工具为编译器。
而解释型语言,在程序运行时才被“翻译”为机器语言。但是执行一次“翻译”一次,所以执行效率较低。解释器的工作就是解释型语言中,负责“翻译”源代码的程序。
对于一段C语言代码,需要经过预编译、编译、汇编和链接,才能成为可执行的二进制文件。
以C语言为代表的编译型语言,代码发生更新都要经过以上步骤。
编译型语言的执行示意:
对编译型语言与解释型语言的区别的理解,立足于源代码被编译成目标平台CPU指令的时机。对于编译型语言,编译结果已经是针对当前CPU体系的指令;而解释型语言,需要先编译成中间代码,再经由该解释型语言的特定虚拟机,翻译成特定CPU体系的指令被执行。解释型语言是在运行过程中,翻译为目标平台的指令。常说解释型语言“慢”,主要也是慢在这里。
在PHP 7中,源代码首先进行词法分析,将源代码切割为多个字符串单元,分割后的字符串称为Token。而一个一个独立的Token是无法表达完整语义的,需经过语法分析阶段,将Token转换为抽象语法树(简称AST)。之后,抽象语法树被转换为机器指令执行。在PHP中,这些指令称为opcode。
第1步:源码通过词法分析得到Token。
第2步:基于语法分析器生成抽象语法树(AST)。
第3步:抽象语法树转换为opcodes(opcode指令集合),PHP解释执行opcodes。
1.Token
Token是PHP代码被切割成的有意义的标识。PHP提供了token_get_all()函数来获取PHP代码被切割后的Token.。
二维数组的每个成员数组的第一个值为Token对应的枚举值。第二个值为Token对应的原始字符串内容。第三个值为代码对应的行号。