Scala组合解析器:原理、实现与应用
1. 符号与字母名称的选择
在编写解析器时,符号运算符和字母名称各有优劣。以下是选择两者的一些准则:
- 使用符号名称 :当符号已经有普遍公认的含义时,应使用符号名称。例如,在进行数字加法时,没人会建议用 add
代替 +
。
- 优先使用字母名称 :如果希望代码能让普通读者容易理解,应优先选择字母名称。
- 特定领域使用符号名称 :对于特定领域的库,如果使用符号名称在可读性上有明显优势,且不期望普通读者能立即理解代码,那么可以选择符号名称。
在解析器组合器的场景中,这是一种高度特定领域的语言,即使使用字母名称,普通读者也可能难以理解。而且,符号名称对专家来说在可读性上有明显优势,因此在这个应用中使用符号名称是合理的。
为了说明符号名称和字母名称的差异,我们来看一个算术表达式解析器的例子。如果顺序组合运算符 ~
被称为 andThen
,替代运算符 |
被称为 orElse
,原本的解析器代码会变得更长,且难以看出语法结构:
class ArithHypothetical extends JavaTokenParsers {
def expr: Parser[Any] =
term andThen rep(("+" andThen