背景
由于项目中mysql的日志格式只能选用MIXED格式(binlog存在一定的局限性,请 参考),因此需要解析SQL语句。在查找的SQL语句处理器中,都有一定的局限性,而所选中,其中一个基于javacc实现的解析器JSqlParser,使用起来方便,而且代码结构模块很好,基于其重构也比较简单。
虽然项目很久没更新与维护了,基于其改造也可以接受,因此选用了JSqlParser,而这也有了后面的SQL解析器的改造。
javacc简单的介绍
JavaCC 是一个代码生成器,可以根据输入的语言定义输出一个词法分析器和解析器,JavaCC 输出的代码是合法的可编译Java代码.解析器和词法分析器本身就是一个冗长而复杂的组件,手工编写一个这样的程序需要仔细考虑各条件的相互作用,例如分析C语言时,处理整数的代码不可能和处理浮点的代码相互独立,因为整数和浮点数的开头都是数字。而使用像JavaCC 这样的分析器生成器时处理整数的规则和处理浮点数的规则是分开书写的,而两者之间的共享代码在代码生成是被自动添加了.这就增强了程序的模块性,同时也意味着定义文件较手工编写的Java 代码来说更加易于编写,阅读和更改.
上面是一段javacc的简单介绍,总的来说,通过javacc完成一些字符串的分析,还是比较方便,现在普遍使用AST了。javacc相关的资料很少了,(官网:http://javacc.java.net/)
JSqlParser存在的问题及解决
JSqlParser是一个SQL语句的解析器,包括常用的一些SQL语句,insert,update,select,delete等,但兼容的语法有限,比如括号,或者一些复杂的结构等。
JSqlPaerser实现是基于javacc完成对传入SQL语句的词法分析与解析,解析流程按分支一步步实现,相应的代码结构引入是基于visitor设计模式,ja