技术分享 | 使用 TiDB 的 SQL 解析器生成 SQL 指纹

本文介绍了如何利用TiDB SQL解析器来创建SQL指纹,这种方法不同于pt-fingerprint,通过解析SQL语句为抽象语法树并修改节点值,然后还原成SQL文本,简化了实现并提高了准确性。

作者:孙健

爱可生研发工程师,负责高可用组建和 SQL 审核相关开发。

本文来源:原创投稿

*爱可生开源社区出品,原创内容未经授权不得随意使用,转载请联系小编并注明来源。


本文主要介绍如何借助 TiDB SQL 解析自定义生成 SQL 指纹,采用了一种有别于 pt-fingerprint(https://www.percona.com/doc/percona-toolkit/3.0/pt-fingerprint.html) 的方式。

什么是 SQL指纹

SQL 指纹指将一条 SQL 中的字面值替换成其他固定符号。可以用来做 SQL 脱敏或者 SQL 归类。
例如:

select * from t1 where id = 100;

转换成:

select * from t1 where id = ?;

pt-fingerprint 的实现

pt-fingerprint 的代码实现看,它主要是通过正则匹配 SQL 字符串来替换对应字符。代码有 2 千多行,完全通过字符串解析会使得代码及其复杂而难以阅读,好处是无需关心 SQL 语义。

基于 TiDB SQL parser 的实现

TiDB SQL parser 的功能是把 SQL 语句按照 SQL 语法规则进行解析,将文本转换成抽象语法树,另外 TiDB SQL parser 支持将语法树转换成 SQL文本,因此可以通过修改语法树结构达到修改 SQL 文本的目的。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值