ORACLE终于在10G中提供了对正则表达式的支持,以前那些需要通过LIKE来进行的复杂的匹配就可以通过使用正则表达式更简单的实现。
Oracle10g正则表达式提高了SQL灵活性。有效的解决了数据有效性,重复词的辨认,无关的空白检测,或者分解多个正则组成的字符串等问题。
Oracle10g支持正则表达式的四个新函数分别,它们使用POSIX正则表达式代替了老的百分号(%)和通配符(_)字符。
1,REGEXP_LIKE:与LIKE的功能相似
2,REGEXP_INSTR:与INSTR的功能相似:返回字符的个数
3,REGEXP_SUBSTR:与SUBSTR的功能相似:截取字符串
4,REGEXP_REPLACE:与REPLACE的功能相似
在新的函数中使用正则表达式来代替通配符‘%’和‘_’。
正则表达式由标准的元字符(metacharacters)所构成:
'^'匹配输入字符串的开始位置,在方括号表达式中使用,此时它表示不接受该字符集合。
'$'匹配输入字符串的结尾位置。如果设置了RegExp对象的Multiline属性,则$也匹配'n'或'r'。
'.'匹配除换行符n之外的任何单字符。
'?'匹配前面的子表达式零次或一次。
'+'匹配前面的子表达式一次或多次。
'*'匹配前面的子表达式零次或多次。
'|'指明两项之间的一个选择。例子'^([a-z]+|[0-9]+)$'表示所有小写字母或数字组合成的字符串。
'()'标记一个子表达式的开始和结束位置。
'[]'标记一个中括号表达式。
'{m,n}'一个精确地出现次数范围,m=<出现次数<=n,'{m}'表示出现m次,'{m,}'表示至少出现m次。
num匹配num,其中num是一个正整数。对所获取的匹配的引用。
字符簇:
[[:alpha:]]任何字母。
[[:digit:]]任何数字。
[[:alnum:]]任何字母和数字。
[[:space:]]任何白字符。
[[:upper:]]任何大写字母。
[[:lower:]]任何小写字母。
[[:punct:]]任何标点符号。
[[:xdigit:]]任何16进制的数字,相当于[0-9a-fA-F]。
各种操作符的运算优先级
1.转义符
2.(),(?:),(?=),[]圆括号和方括号
3.*,+,?,{n},{n,},{n,m}限定符
4.^,$,anymetacharacter位置和顺序
4.|“或”操作
示例:
一、REGEXP_LIKE
/*Formattedon2009/11/1119:03(FormatterPlusv4.8.8)*/
SELECT*
FROMscott.emp
WHEREREGEXP_LIKE(ename,'^a{1,3}');
SELECT*
FROMscott.emp
WHEREREGEXP_LIKE(ename,'a{1,2}');
SELECT*
FROMscott.emp
WHEREREGEXP_LIKE(ename,'^a.*e$');
SELECT*
FROMscott.emp
WHEREREGEXP_LIKE(ename,'^[[:lower:]]|[[:digit:]]');
SELECT*
FROMscott.emp
WHEREREGEXP_LIKE(ename,'^[[:lower:]]');
SELECTsal
FROMscott.emp
WHEREREGEXP_LIKE(sal,'[^[:digit:]]');
SELECTsal
FROMscott.emp
WHEREREGEXP_LIKE(sal,'^[^[:digit:]]');
二、REGEXP_INSTR
/*Formattedon2009/11/1119:03(FormatterPlusv4.8.8)*/
SELECTREGEXP_INSTR(ename,'[[:digit:]]$')
FROMscott.emp;
SELECTREGEXP_INSTR(mc,'[[:digit:]]+$')
FROMscott.emp;
SELECTREGEXP_INSTR('Thepriceis$400.','$[[:digit:]]+')
FROMDUAL;
SELECTREGEXP_INSTR('onetwothree','[^[[:lower:]]]')
FROMDUAL;
SELECTREGEXP_INSTR(',,,,,','[^,]*')
FROMDUAL;
SELECTREGEXP_INSTR(',,,,,','[^,]')
FROMDUAL;
三、REGEXP_SUBSTR
/*Formattedon2009/11/1119:04(FormatterPlusv4.8.8)*/
SELECTREGEXP_SUBSTR(ename,'[a-z]+')
FROMscott.emp;
SELECTREGEXP_SUBSTR(sal,'[0-9]+')
FROMscott.emp;
SELECTREGEXP_SUBSTR('aababcde','^a.*b')
FROMDUAL;
四、REGEXP_REPLACE
/*Formattedon2009/11/1119:06(FormatterPlusv4.8.8)*/
SELECTREGEXP_REPLACE('JoeSmith','(){2,}',',')ASrx_replace
FROMDUAL;
SELECTREGEXP_REPLACE('aabbcc','(.*)(.*)(.*)','3,2,1')
FROMDUAL;