上次简单地介绍了一些词法分析
.class public Lcom/F8LEFT;
可以被分割为三个Token “.class” “public” “Lcom/F8LEFT;”
像这一类Token都可以按照其作用分为多种Token
比如,public private static等可以划分为flag的Token
分析器可以接收这一类Token,并且按照预定的规则进行分析。
那么,对于程序来说应该怎么去把这种字符串分析为相应的Token呢?
有一种比较简单的方法,就是利用正则表达式
比如,flag的正则为
public | private | static
通过定义多个正则可以准确地划分字符串为合适的Token。
然而,考虑到效率,是不建议对每一个Token进行比较,扫描的。因此,有必要寻求一种更高效的方法对字符串进行扫描。
举例来说,假如要区分IF ID,用c++可以这样实现
if(strcmp(src, "IF") == 0)
return TOK_IF;
else if(strcmp(src, "ID"

本文探讨了在分析Smali文件时如何进行词法分析,特别是如何将字符串转换为Token。文章提到了使用正则表达式划分Token的方法,但鉴于效率考虑,建议采用自动机进行字符串扫描。自动机通过比较每个字符来决定判断流程,能有效提高效率。在ART项目中,使用flex库来实现词法分析,为后续的深入分析奠定了基础。
最低0.47元/天 解锁文章
954

被折叠的 条评论
为什么被折叠?



