最近在用python做DDL SQL的分析,用的是simple_ddl_parser1.5.1。遇到了一些问题,记录一下。
simple_ddl_parser能解析多种数据库的DDL语句,我要处理的是mysql的DDL,发现有些mysql的写法还是不支持:
- 在表层面不支持使用CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci
- UNIQUE INDEX语法不支持,只能支持UNIQUE KEY
- ALTER TABLE xx ADD COLUMN xx不支持,必须写成ADD xx,不能要中间的那个COLUMN关键字。奇怪的是,DROP COLUMN则必须要COLUMN关键字…
- insert语句能支持,遇到update语句则会报错…
这种情况需要我们对DDL做一些预处理,才能获得表结构的信息。
顺带说一个小窍门,就是DDLParser有一个silent=True选项,默认是关闭的,跳过语法错。但如果发现有的DDL解析不出来,可以临时打开该选项,看看究竟是哪一处语法不支持,非常快捷。
另外,记得要把normalize_names=True选项打开,可以自动为我们处理各种形式的表名或字段名,例如:
`t_testtbl`
[t_testtbl]
会被输出为我们需要的t_testtbl