文章目录
一、关于正则表达式
正则表达式:描述字符串结构模式的 形式化表达方法。
我所理解的正则,就是对文本内容进行增删改查。
大部分有经验的程序员都多少接触过正则,比如匹配邮箱、电话;
但如果你想查重,想自己编写更细腻精准的正则,难免会遇到问题。
虽然网上资料很多,但稍有深度就查不出来,还很多错漏,个人觉得有这功夫不如傻傻的看书:《精通正则表达式》
这里记录我分享我看书所得,当然有不全面的地方,欢迎留言提问。
宿主语言及工具
我们可以看到不同的语言都支持正则,称这些语言为 宿主语言,如 perl, java, python, php 等;
通知说系统自带的 egrep,sed 等工具也可以编写正则;
(grep : global regular expression print ,egrep 为拓展的 grep )
本篇先介绍 使用宿主语言 python 的 re 模块介绍如何调用正则;
后面总结基础的正则、然后继续深入其他正则表达。