安卓字节码反编译:ANTLR 工具与实践
1. ANTLR 简介
ANTLR(Another Tool for Language Recognition)是一款强大的语言识别工具,可从 www.antlr.org 下载。它是一种递归下降、LL(k) 或自顶向下的解析器,与 Yacc(LR 或自底向上解析器)不同,ANTLR 从最顶层规则开始尝试识别标记,逐步向外扩展到叶子节点;而 Yacc 则从叶子节点开始,向上构建到最高规则。
ANTLR 与 JLex 和 CUP 的根本区别在于,词法分析器和解析器位于同一个文件中。创建标记的词法规则全部为大写(例如 IDENT
),而标记解析规则全部为小写(例如 program
)。
ANTLR v3 是对 ANTLR v2 的完全重写,还包含了一些非常有用的附加功能,如 StringTemplates
,它可以将输出语句从解析器中分离出来。
2. ANTLR 示例:DexToXML
DexToXML 是一个用 ANTLR v3 编写的 classes.dex
解析器,用于解析 dedexer
输出并将文本转换为 XML。以下是一个简单的示例,展示了如何使用正则表达式识别十六进制数字对:
HEX_DIGIT : ('0'..'9'|'a'..'f'|'A'..'F')('0'..'9'