通过正则表达式反向生成字符串

原创

已于 2023-11-08 15:09:38 修改 · 868 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#正则表达式 #安全 #网络

于 2023-11-08 15:09:31 首次发布

本文介绍了正则表达式的匹配原理，Go语言中`regexp`库的解析过程，以及如何通过反向生成技术（如YAK的regen库）生成符合特定正则规则的字符串，包括实际应用案例和YAK的相关资源链接。

正则表达式在文本分析中是一种非常强大的工具，它可以描述一个字符串，我们可以使用这个描述去匹配、搜索字符串。

既然正则是对字符串的描述，那么我们可以用这个描述去匹配已知的字符串是否符合这个描述，当然也可以通过这个描述去生符合这个描述的字符串，取反就是生成不符合这个描述的字符串，也可以通过给定几组字符串的子串去找到这些子串的共同特征，然后通过正则语言表述出来，实现自动生成正则了，等等…

本文将为大家介绍如何通过正则去生成符合规则的字符串。

Part 1.正则表达式匹配原理

开始之前先了解下正则表达式的工作原理是什么。正则表达式符合正则文法，可以基于有限状态自动机实现，例如表达式 a(b|c)*，对应的确定性有限状态自动机（DFA）

起始状态是0，当输入字符a时状态转为1，输入b时状态变为2，输入c时状态变为3。如果输入的字符串的每一个字符输入都会转移到一个状态，就是这个字符串可以在这个自动机里跑完，那就可以匹配成功。

Part 2.regexp库的解析过程

我们以go的regexp.Match函数为例

可以看见，在Match前需要先编译

最低0.47元/天解锁文章

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。