SQL——正则表达式

本文介绍了正则表达式的基本概念,包括其作为文本模式的用途和在数据库,尤其是MySQL中的应用。通过示例展示了如何使用LIKE和REGEXP进行模糊匹配和复杂规则的字符串搜索,帮助读者理解和运用正则表达式在SQL查询中的功能。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

正则表达式的基本概念

正则表达式,又称规则表达式是计算机科学的一个概念。

(英语:Regular Expression,在代码中常简写为regex、regexp或RE)

正则表达式是对字符串(包括普通字符(例如,a 到 z 之间的字母)和特殊字符(称为“元字符”))操作的一种逻辑公式,

就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。

正则表达式是一种文本模式,该模式描述在搜索文本时要匹配的一个或多个字符串。

正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本。

许多程序设计语言都支持利用正则表达式进行字符串操作。

顾名思义,就是一个有规则的表达式,按照这个规则的表达式去搜索匹配这个规则的字符串。

如AXXX;BXXX;这种规则表达式。

 

正则表达式在数据库的应用

MySQL可以通过 LIKE ...% 来进行模糊匹配。

%、_、[a-d]与一些字符组合而成的匹配规则式就是正则表达式,这是在SQL里最常用的用法。

 

更复杂的正则表达式

MySQL 同样也支持其他正则表达式的匹配, MySQL中使用 REGEXP 操作符来进行正则表达式匹配。

如果您了解PHP或Perl,那么操作起来就非常简单,因为MySQL的正则表达式匹配与这些脚本的类似。

一般这种复杂的写法不用,用%、_、[abc]这些匹配模式基本也够用了。

下表中的正则模式可应用于 REGEXP 操作符中。

模式描述
^匹配输入字符串的开始位置。如果设置了 RegExp 对象的 Multiline 属性,^ 也匹配 '\n' 或 '\r' 之后的位置。='a%'
$匹配输入字符串的结束位置。如果设置了RegExp 对象的 Multiline 属性,$ 也匹配 '\n' 或 '\r' 之前的位置。='%a'
.匹配除 "\n" 之外的任何单个字符。要匹配包括 '\n' 在内的任何字符,请使用像 '[.\n]' 的模式。
[...]字符集合。匹配所包含的任意一个字符。例如, '[abc]' 可以匹配 "plain" 中的 'a'。只匹配单个字符,该字符在方括号内即可。
[^...]负值字符集合。匹配未包含的任意字符。例如, '[^abc]' 可以匹配 "plain" 中的'p'。^是否定意思的脱字号。只匹配单个字符,该字符在方括号内即可。
p1|p2|p3匹配 p1 或 p2 或 p3。例如,'z|food' 能匹配 "z" 或 "food"。'(z|f)ood' 则匹配 "zood" 或 "food"。
*匹配前面的子表达式零次或多次。例如,zo* 能匹配 "z" 以及 "zoo"。* 等价于{0,}。
+匹配前面的子表达式一次或多次。例如,'zo+' 能匹配 "zo" 以及 "zoo",但不能匹配 "z"。+ 等价于 {1,}。
{n}n 是一个非负整数。匹配确定的 n 次。例如,'o{2}' 不能匹配 "Bob" 中的 'o',但是能匹配 "food" 中的两个 o。 ='%oo%',当然也会匹配到fooo,因为也符合%oo%。
{n,m}m 和 n 均为非负整数,其中n <= m。最少匹配 n 次且最多匹配 m 次。例如,o{2,5},匹配2到5个o。也没有限制前后是否还可以再出现o,如果大于5也是可以匹配到的。因为foooooooo也符合该表达式。

 

实例

了解以上的正则需求后,我们就可以根据自己的需求来编写带有正则表达式的SQL语句。

以下我们将列出几个小实例(表名:person_tbl )来加深我们的理解:

 

查找name字段中以'st'为开头的所有数据:

mysql> SELECT name FROM person_tbl WHERE name REGEXP '^st';

等于SELECT name FROM person_tbl WHERE name like 'st%';

 

查找name字段中以'ok'为结尾的所有数据:

mysql> SELECT name FROM person_tbl WHERE name REGEXP 'ok$';

 

查找name字段中包含'mar'字符串的所有数据:

mysql> SELECT name FROM person_tbl WHERE name REGEXP 'mar';

 

查找name字段中以元音字符开头或以'ok'字符串结尾的所有数据:

mysql> SELECT name FROM person_tbl WHERE name REGEXP '^[aeiou]|ok$';

I为‘或’ = or

 

### SQL 中嵌套正则表达式的用法 在 SQL 查询中,可以通过 `REGEXP` 或者类似的函数来实现基于正则表达式的条件筛选。当涉及到更复杂的模式匹配需求时,比如验证电子邮件地址的有效性或是提取特定格式的数据片段,则可能需要用到组合多个正则表达式逻辑的情况——即所谓的“嵌套”。 对于某些数据库管理系统(DBMS),如 MySQL,在单层的正则表达式基础上并没有直接提供多级嵌套的支持机制。但是这并不意味着无法完成复杂模式下的数据检索工作。一种间接的方法就是先利用子查询选出初步符合条件的结果集,再在此之上应用进一步过滤。 #### 使用子查询实现分步处理 考虑这样一个场景:要查找表内所有含有合法邮箱形式字符串的同时还带有指定域名后缀(例如 .edu)记录项。这里可以分为两部分来进行: 1. 初步定位到形似 email 的字段值; 2. 对这些候选对象做二次检验确认其确实属于目标范围内的具体实例。 ```sql SELECT * FROM ( SELECT id, content FROM my_table WHERE content REGEXP '^[A-Za-z0-9]+([_.][A-Za-z0-9]+)*@[A-Za-z0-9\\-_\\.]+$' ) AS temp_emails WHERE content REGEXP '\\.[eE]du$'; ``` 上述语句首先通过外层的 `content REGEXP ...` 定位到了看起来像是邮件地址的内容[^3],接着内部又加了一重限定只保留那些以 `.edu` 结尾的情形。这种方式虽然不是严格意义上的“嵌套”,但在功能上达到了相同的效果,并且保持了良好的可读性和维护性。 另外值得注意的是不同 DBMS 可能会存在语法差异以及性能上的考量因素,因此实际编写过程中应当参照所使用的具体版本文档说明调整相应写法。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值