作用
匹配文本,将一个模式(正则表达式)与一个文本串进行比较。MySQL
用WHERE子句对正则表达式提供了初步的支持,允许你指定正则表达式,
过滤SELECT检索出的数据
基本字符匹配
检索列bookname包含文本java的所有行:
输入:
select bookname
from bookinfo
where bookname REGEXP 'java';
输出:
+--------------+
| bookname |
+--------------+
| Java2核心技? |
+--------------+
1 row in set (0.53 sec)
分析:
关键字LIKE被REGEXP替代外,这条语句看上去非常像使用 LIKE的语句
它告诉MySQL:REGEXP后所跟的东西作为正则表达式
(与文字正文java匹配的一个正则表达式)处理
. 点操作符号
输入:
select bookname
from bookinfo
where bookname REGEXP '.111';
输出:
+------------+
| bookname |
+------------+
| ?睡之城111 |
+------------+
1 row in set (0.00 sec)
分析:
这里使用了正则表达式.111
.是正则表达式语言中一个特殊的字符
它表示匹配任意一个字符,因此, ?睡之城111 都匹配且返回
like与 regexp
LIKE匹配整个列。如果被匹配的文本在列值 中出现,LIKE将不会找到它,相应的行也不被返回(除非使用 通配符)。
而REGEXP在列值内进行匹配,如果被匹配的文本在 列值中出现,REGEXP将会找到它,相应的行将被返回
进行OR匹配
为搜索两个串之一(或者为这个串,或者为另一个串),使用|
输入
select bookname from bookinfo where bookname REGEXP 'java|111';
输出
+--------------+
| bookname |
+--------------+
| Java2核心技? |
| ?睡之城111 |
+--------------+
2 rows in set (0.04 sec)
分析
使用|从功能上类似于在SELECT语句中使用OR语句
多个OR条件可并入单个正则表达式
匹配几个字符之一
想匹配特定的字符使用 [和]
如: [123]b ,这里使用了正则表达式,[123]定义一组字符,1b或者2b或者3b都会返回
输入
select bookname from bookinfo where bookname REGEXP '[123] b'
输出
+--------------+
| bookname |
+--------------+
| 1b |
| 2b |
+--------------+
2 rows in set (0.04 sec)
分析:
[]是另一种形式的OR语句
正则表达式[123]Ton 为[1|2|3]Ton的缩写,也可以使用后者
但是,需要用[]来定义OR语句查找什么
匹配范围
匹配数字0到9:
[0123456789]
可以简化为[0-9]
如[0-9]a
匹配特殊字符
为了匹配特殊字符,必须用\为前导。\-表示查找-,\.表示查找.
一些其他意思:
- \f 换页
- \n 换行
- \r 回车
- \t 制表
- \v 纵向制表
匹配字符类
[:alnum:] 任意字母和数字(同[a-zA-Z0-9])
[:alpha:] 任意字符(同[a-zA-Z])
[:blank:] 空格和制表(同[\t])
[:cntrl:] ASCII控制字符(ASCII 0到31和127)
[:digit:] 任意数字(同[0-9])
[:graph:] 与[:print:]相同,但不包括空格
[:lower:] 任意小写字母(同[a-z])
[:print:] 任意可打印字符
[:punct:] 既不在[:alnum:]又不在[:cntrl:]中的任意字符
[:space:] 包括空格在内的任意空白字符(同[\f\n\r\t\v])
[:upper:] 任意大写字母(同[A-Z])
[:xdigit:] 任意十六进制数字(同[a-fA-F0-9])
匹配多个实例
-
0个或多个匹配
-
1个或多个匹配(等于{1,})
-
? 0个或1个匹配(等于{0,1})
-
{n} 指定数目的匹配
-
{n,} 不少于指定数目的匹配
-
{n,m} 匹配数目的范围(m不超过255)
正则表达式\([0-9] sticks?\)
\(匹配), [0-9]匹配任意数字(这个例子中为1和5)
sticks?匹配stick 和sticks(s后的?使s可选,因为?匹配它前面的任何字符的0次或1次出 现),\)匹配)
没有?,匹配stick和sticks会非常困难
[:digit:]匹配任意数字,因而它为数字的一个集 合。{4}确切地要求它前面的字符(任意数字)出现4次,所以 [[:digit:]]{4}匹配连在一起的任意4位数字
定位符
为了匹配特定位置的文本如下:
^ 文本的开始
$ 文本的结尾
[[:<:]] 词的开始
[[:>:]] 词的结尾
找出以一个数(包括以小数点开始的数)开始的所有产品
匹配串的开始。因此,[0-9\.]只在.或任意数字为串中第1个字符时才匹配它们。
没有^,则还要多检索出4个别的行(那些中间有数字的行)
-
**^**的双重用途
-
- ^有两种用法。在集合中(用[和]定义),用它 来否定该集合,否则,用来指串的开始处。
- 使REGEXP起类似LIKE的作用 本章前面说过,LIKE和REGEXP 的不同在于,LIKE匹配整个串而REGEXP匹配子串。利用定位 符,通过用^开始每个表达式,用$结束每个表达式,可以使 REGEXP的作用与LIKE一样。
0-9\. ↩︎