在一些系统中需要对SQL查询语句进行解析,并最终根据业务需求将其转换处理将其转换为真实的SQL语句,这一过程我把它简称为:逻辑SQL-物理SQL的转换。在这一过程其中的关键技术是逻辑SQL语法分析,语法分析实现采用例如树型语法分析模型等方式实现,它是以二叉树方式,针对SQL中的关键字(例如:Select,From,Where等)进行判断并作为节点形成树型基本结构,再以二叉树方式加载查询数据(例如:查询字段,表名,条件等),最后形成二叉树结构模型,为后续的逻辑模型转换为物理模型提供词元数据,最后借助元数据系统辅助实现SQL语句转换工作。
逻辑SQL语句的解析(LSQL Parse)在技术上主要依托Antlr产品来实现。而ANTLR是语言识别的一种工具。它可以接受语法规则描述,并能根据语法规则自动产生识别这些符合语法规则的语句的程序。它作为翻译程序的一部分,可以允许使用简单的操作符和动作来表达你的语法规则,从而帮助ANTLR轻松简单地创建抽象语法树(AST)和产生最终输出信息。ANTLR能够知道怎样去生成识别程序,语言包括Java,C++,C#和Python等。
逻辑SQL语句的解析(LSQL Parse)在技术上主要依托Antlr产品来实现。而ANTLR是语言识别的一种工具。它可以接受语法规则描述,并能根据语法规则自动产生识别这些符合语法规则的语句的程序。它作为翻译程序的一部分,可以允许使用简单的操作符和动作来表达你的语法规则,从而帮助ANTLR轻松简单地创建抽象语法树(AST)和产生最终输出信息。ANTLR能够知道怎样去生成识别程序,语言包括Java,C++,C#和Python等。
逻辑SQL脚本自动解析功能借助Antlr来实现对逻辑SQL脚本的词法、语法和语义分析,然后将逻辑SQL语句根据规则自动分拆为不同词元,并生成AST(抽象语法树)对象结构进行存储,后续的逻辑SQL检查与转换工作将主要围绕解析后生成的AST对象展开。具体的逻辑SQL完整解析过程如下图所示:
图:LSQL语句解析全过程示意图
为了能够不断地对后续逻辑SQL解析功能的完善和应用扩展,在系统实现过程中将逻辑SQL解析模块封装形成了独立组件,整体上保持形成一个较为松耦合的架构。其中逻辑SQL解析组件主要负责进行逻辑SQL语句按照设定的词法规则分拆成为特定的词元(Token),并在词元分拆的基础上进行相应的语法分析(主要依据设定的语法规则进行),最后将符合词法与语法要求的LSQL转换成为由若干词元形