正则表达式(Regular Expression,常简写为 regex、regexp)是一种用于描述字符串模式的特殊文本序列,主要用于字符串的匹配、查找、替换和验证等操作。它通过一些预定义的规则和特殊字符,构建出一个 "模式",然后用这个模式去匹配目标字符串中符合规则的部分。
核心作用
- 匹配验证:检查字符串是否符合特定格式(如邮箱、手机号、URL 等)
- 搜索提取:从文本中找出符合模式的内容(如提取所有数字、邮箱地址)
- 替换修改:替换文本中符合模式的部分(如批量替换敏感词)
基本组成
- 普通字符:如字母(a-z, A-Z)、数字(0-9)等,代表字符本身
- 特殊元字符:具有特殊含义的字符,例如:
.:匹配任意单个字符(除换行符)*:匹配前面的字符 0 次或多次+:匹配前面的字符 1 次或多次?:匹配前面的字符 0 次或 1 次^:匹配字符串的开始位置$:匹配字符串的结束位置[]:定义字符集合(如[0-9]匹配任意数字)():定义子表达式(用于分组或捕获)
示例
- 匹配邮箱的简单正则:
\w+@\w+\.\w+- 含义:匹配 "字母 / 数字 @字母 / 数字。字母 / 数字" 格式的字符串
- 匹配手机号(中国大陆):
^1[3-9]\d{9}$- 含义:以 1 开头,第二位是 3-9,后面跟 9 位数字,且整体长度为 11 位
应用场景
正则表达式在编程(如 Python、JavaScript、Java 等)、文本编辑器(如 VS Code、Sublime)、数据库查询(如 MySQL 的 REGEXP)等领域被广泛使用,是处理字符串的强大工具。不过,复杂的正则表达式可能可读性较差,需要在简洁性和可维护性之间平衡。
1万+

被折叠的 条评论
为什么被折叠?



