正则表达式

1.匹配任意字符: 比如要 <body> 标签里的所有内容,包括换行符、空白符号等

[/s/S]* 它的意思是任意空白字符和非空白字符。同理,也可以用 “[/d/D]*”、“[/w/W]*” 来表示。例如:"<body[\\s\\S]+body>"

 匹配到结尾: "内容[//s|//S]*"

注意:在双引号内要多写一个转义符/

2.匹配一行内的任意字符可使用 "内容1.*?内容2"

   摆脱 内容1,内容2    (?<=内容1).*?(?=内容2)

  .*与.*?区别:

   举例1:表达式 "<td>(.*)</td>" 与字符串 "<td><p>aa</p></td> <td><p>bb</p></td>" 匹配时,匹配的结果是:成功;匹配到的内容是 "<td><p>aa</p></td> <td><p>bb</p></td>" 整个字符串, 表达式中的 "</td>" 将与字符串中最后一个 "</td>" 匹配。

    举例2:相比之下,表达式 "<td>(.*?)</td>" 匹配举例1中同样的字符串时,将只得到 "<td><p>aa</p></td>", 再次匹配下一个时,可以得到第二个 "<td><p>bb</p></td>"。


NSString* jsonString=@"<body>aabbcc\nddeeff</body>";
str=[jsonString stringByMatching:@"<body>([\\s\\S]+?)</body>" capture:1];


Regexkit Lite和iPhone解析

http://www.cocoachina.com/bbs/read.php?tid-18111.html

http://baike.baidu.com/view/94238.htm

http://www.regexlab.com/zh/regref.htm

http://www.minroad.com/?p=85

http://regexkit.sourceforge.net/#RegexKitLite

http://regexkit.sourceforge.net/RegexKitLite/index.html#NSString_RegexKitLiteAdditi*****__Xcode3IntegratedDocumentation

 

一些高级规则:

贪婪模式,非贪婪模式;

反向引用;


private final static String regxpForHtml = "<([^>]*)>"; // 过滤所有以<开头以>结尾的标签
private final static String regxpForImgTag = "<\\s*img\\s+([^>]*)\\s*>"; // 找出IMG标签
private final static String regxpForImaTagSrcAttrib = "src=\"([^\"]+)\""; // 找出IMG标签的SRC属性

 

2. java

   str.split("//^");

   str.split("//^ | //.");

 

   字符串>aaa<,使用正则表达式>(.*?)<,在java中的结果为>aaa<,使用其它工具的结果为aaa。

 

   替换掉所有的非数字 id=id.replaceAll("[^0-9]", "");

 

3.判断是否匹配.

    5到12个数字:  "^//d{5,12}$"

    11位数字:  "^//d{11}$"

    不限长数字:"^//d+$

    6到32个 任意一个字母或数字或下划线,也就是 A~Z,a~z,0~9,_ 中任意一个:   "^\\w{6,32}$"

    6到32个  任意一个字母或数字或下划线,也就是 A~Z,a~z,0~9,_ 中任意一个,但不包含@:"^((?!@)\\w){6,32}$"

    6到32个 数字且字母: "(?!@)(?!^[0-9]*$)(?!^[a-zA-Z]*$)^([a-zA-Z0-9]{6,32})$"

     6到32个 数字且字母,但不包含@:"(?!@)(?!^[0-9]*$)(?!^[a-zA-Z]*$)^([a-zA-Z0-9]{6,32})$"

    6到32个 数字且字母,不能全是数字,不包含@:"(?!@)(?!^[0-9]*$)^([a-zA-Z0-9]{6,32})$"

    邮箱:^(\\w+@(\\w+\\.)+\\w{2,3})?$

   简化邮箱判断  ^(.+@.+)?$ ,即只要@符号前和后都必须有一个字符就可以。



    如果要要求表达式所匹配的内容是整个匹配字符串,而不是匹配字符串中的一部分,那么可以在表达式的首尾使用 "^" 和 "$",比如:"^//d+$" 要求整个字符串只有数字。


注意:/ 约束条件/,//之间的是约束条件,^是开始字符,$是结束字符,不起作用的情况下可以前面加^,并以+$是结束字符

1、 。句点符号表示任意一个字符;

2、[ ] 方括号表示匹配可以匹配方括号中的任意点单个字符,方括号只允许匹配单个字符。

3、| “或”符号表示小括号的任意一组字符,它不能和方括号使用,只能和小括号使用。

4、表示匹配次数的符号,它们都是对前面的指定字符起作用

*:表示匹配0次或多次

?:表示匹配0次或一次

+:表示至少匹配一次

{n}:表示匹配n次

{n,m}:表示从n次到m次

5、“否”符号 “^”符号称为“否”符号。如果用在方括号内,“^”表示不想要匹配的字符。

6、边界匹配符

^ 一行的开始

$ 一行的结尾

\b 一个单词的边界

\B 一个非单词的边界

\G 前一个匹配的结束

7、转义字符

转义符号“\”转义后代表的含义如下:
s:匹配单个的空格符
S:用于匹配除单个空格符之外的所有字符。
d:用于匹配从0到9的数字,相当于“/[0-9]/”。
w:用于匹配字母,数字或下划线字符,相当于“/[a-zA-Z0-9_]/”。
W:用于匹配所有与w不匹配的字符,相当于“/[^a-zA-Z0-9_]/”。
D:用于匹配任何非10进制的数字字符。
.:用于匹配除换行符之外的所有字符,如果经过修饰符“s”的修饰,“.”可以代表任意字符。

常见实例:

1、   非空匹配:/\S+/

2、   表示字符串不含空格:^[\s]*$ 

3、   如果想不包括空格及其它空白字符    ^[^\s]*$

4、   要插入一个反斜杠,那就得用"\\\\",尤其在java代码中。关于unicode的编码可以查看电脑菜单中的

附件——系统工具——字符映射表,注意要判断字符串中是中括号“[”和“]”,在java代码中采用这样的方法:(加两个\\)String constraint = "^[\\u005b\\u005d]+$";

5、  数字和字母的组合,不能只是数字或只是字母:/(?!^[0-9]*$)(?!^[a-zA-Z]*$)^([a-zA-Z0-9]{2,})$/

6、  字符串是否为连续的中文字符(不包含英文及其他任何符号和数字):/^[\u4e00-\u9fa5]+$/

7、   输入必须是双字节字符:/^[^\x00-\xff]+$/

8、   不能输入中文/^[^\u4e00-\u9fa5]+$/ (中文字符不止  \u4E00-\u9FA5 这个区,还有 \uF900-\uFA2D 这个区)

9、  字符串仅包含英文,不包含其它的:/^[a-zA-Z]+$/

10、              字符串仅包含数字,不包含其它的:/^\d+$/

11、              字符串仅包含数字、英文和下划线:/^\w+$/

12、 字符串仅包含数字、英文和下划线且不能为空:/\w+/

13、 字符串仅包含数字、英文和下划线和空格:/^[\w\s]+$/

14、 小数点后只能两位,如果小数点后便没有数字的话,不能出现小数点:/^[0-9]+$|^[0-9]+\.[0-9]{1,2}$/

15、 可包含大小写英文字母,数字,字符_,字符-:^[A-Za-z0-9_-]+$

16、 字符串仅包含数字、英文且不能为空/^[0-9a-zA-Z_]*$/

17、 输入只包含中文、数字和字母:/^[a-z\A-Z\d\u4E00-\u9FA5]+$/

18、 字母和数字的组合,不能单独输入字母或数字:/(?!^[0-9]*$)(?!^[a-zA-Z]*$)^([a-zA-Z0-9]{2,})$/

19、 输入字母和数字的组合,6位到15位:/([a-zA-Z0-9]{6,15})?/

20、 电话号码的验证:/([0-9]{3,4}[-][0-9]{6,8}([-][0-9]{3,6})?)?/

21、 电子邮件的验证:/(\w+@(\w+\.)+\w{2,3})?/

22、 Ip地址的验证表达式:/((2[0-4]\d|25[0-5]|[01]?\d\d?)\.){3}(2[0-4]\d|25[0-5]|[01]?\d\d?)/

23、 必须为正数,且数字第一个不能为0:/^([1-9][0-9]*)$/

24、 日期判断正则表达式:      

YYYY-MM-DD基本上把闰年和2月等的情况都考虑进去了
^((((1[6-9]|[2-9]\d)\d{2})-(0?[13578]|1[02])-(0?[1-9]|[12]\d|3[01]))|(((1[6-9]|[2-9]\d)\d{2})-(0?[13456789]|1[012])-(0?[1-9]|[12]\d|30))|(((1[6-9]|[2-9]\d)\d{2})-0?2-(0?[1-9]|1\d|2[0-8]))|(((1[6-9]|[2-9]\d)(0[48]|[2468][048]|[13579][26])|((16|[2468][048]|[3579][26])00))-0?2-29-))$

下面的是加了时间验证的
^((((1[6-9]|[2-9]\d)\d{2})-(0?[13578]|1[02])-(0?[1-9]|[12]\d|3[01]))|(((1[6-9]|[2-9]\d)\d{2})-(0?[13456789]|1[012])-(0?[1-9]|[12]\d|30))|(((1[6-9]|[2-9]\d)\d{2})-0?2-(0?[1-9]|1\d|2[0-8]))|(((1[6-9]|[2-9]\d)(0[48]|[2468][048]|[13579][26])|((16|[2468][048]|[3579][26])00))-0?2-29-)) (20|21|22|23|[0-1]?\d):[0-5]?\d:[0-5]?\d$

25、 只能输入数字:“^[0-9]*$”

26、 只能输入n位的数字:“^\d{n}$”

27、 只能输入至少n位数字:“^\d{n,}$”

28、 只能输入m-n位的数字:“^\d{m,n}$”

29、 只能输入零和非零开头的数字:“^(0|[1-9][0-9]*)$”

30、 只能输入有两位小数的正实数:“^[0-9]+(.[0-9]{2})?$”

31、 只能输入有1-3位小数的正实数:“^[0-9]+(.[0-9]{1,3})?$”

32、 只能输入非零的正整数:“^\+?[1-9][0-9]*$”

33、 只能输入非零的负整数:“^\-[1-9][0-9]*$”

34、 只能输入长度为3的字符:“^.{3}$”

35、 只能输入由26个英文字母组成的字符串:“^[A-Za-z]+$”

36、 只能输入由26个大写英文字母组成的字符串:“^[A-Z]+$”

37、 只能输入由26个小写英文字母组成的字符串:“^[a-z]+$”

38、 只能输入由数字和26个英文字母组成的字符串:“^[A-Za-z0-9]+$”

39、 只能输入由数字、26个英文字母或者下划线组成的字符串:“^\w+$”

40、 匹配特定数字:

^[1-9]d*$    //匹配正整数

^-[1-9]d*$   //匹配负整数

^-?[1-9]d*$   //匹配整数

Pattern p = Pattern.compile("^(-?[1-9]\\d*)|0|[1-9]\\d*+$");

^[1-9]d*|0$  //匹配非负整数(正整数 + 0)

^-[1-9]d*|0$   //匹配非正整数(负整数 + 0)

^[1-9]d*.d*|0.d*[1-9]d*$   //匹配正浮点数

^-([1-9]d*.d*|0.d*[1-9]d*)$  //匹配负浮点数

^-?([1-9]d*.d*|0.d*[1-9]d*|0?.0+|0)$  //匹配浮点数

^[1-9]d*.d*|0.d*[1-9]d*|0?.0+|0$   //匹配非负浮点数(正浮点数 + 0)

^(-([1-9]d*.d*|0.d*[1-9]d*))|0?.0+|0$  //匹配非正浮点数(负浮点数 + 0)

41、 验证用户密码:“^[a-zA-Z]\w{5,17}$”正确格式为:以字母开头,长度在6-18之间, 只能包含字符、数字和下划线。

42、 验证是否含有^%&',;=?$\"等字符:“[^%&',;=?$\x22]+”

43、 只能输入汉字:“^[\u4e00-\u9fa5],{0,}$”

44、 验证Email地址:“^\w+[-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$

45、 验证Email地址:/.+@.+\.[a-z]+/

46、 验证InternetURL:“^http://([\w-]+\.)+[\w-]+(/[\w-./?%&=]*)?$”

47、 验证电话号码:“^(\(\d{3,4}\)|\d{3,4}-)?\d{7,8}$” 正确格式为:“XXXX-XXXXXXX”,“XXXX-XXXXXXXX”,“XXX-XXXXXXX”, “XXX-XXXXXXXX”,“XXXXXXX”,“XXXXXXXX”。

48、 匹配国内电话号码:d{3}-d{8}|d{4}-d{7}匹配形式如 0511-4405222 或 021-87888822

49、 验证身份证号(15位或18位数字):“^\d{15}|\d{}18$”

50、 验证一年的12个月:“^(0?[1-9]|1[0-2])$” 正确格式为:“01”-“09”和“1”“12”

51、 验证一个月的31天:“^((0?[1-9])|((1|2)[0-9])|30|31)$” 正确格式为:“01”“09”和“1”“31”。

52、 匹配空行的正则表达式:/\n[\s| ]*\r/ 可以用来删除空白行

53、 匹配HTML标记的正则表达式:/<(.*)>.*<\/\1>|<(.*) \/>/

54、 匹配首尾空格的正则表达式:/(^\s*)|(\s*$)/

55、 匹配腾讯QQ号:[1-9][0-9]{4,}腾讯QQ号从10000开始

56、 匹配中国邮政编码:[1-9]d{5}(?!d) 中国邮政编码为6位数字

57、 匹配帐号是否合法(字母开头,允许5-16字节,允许字母数字下划线):^[a-zA-Z][a-zA-Z0-9_]{4,15}$

58、 验证录入的数据只能介于114-116之间,包括小数:/^(114|115|116)(\.\d+)?$/


参考

http://gaojiewyh.iteye.com/blog/405217

http://baike.baidu.com/view/94238.htm


]iPhne开发使用正则表达式

http://www.cnblogs.com/visen-0/archive/2012/02/17/2355921.html


判断内容是否为空,

BOOL contentEmpty=[content length]==0;
    if(!contentEmpty)
    {
        contentEmpty=[content isMatchedByRegex:@"^\\s*$"];//只包括空格、制表符、换页符等空白字符的其中任意一个
    }


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值