
正则表达式
文章平均质量分 69
learn2t
pythonic and autotest
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
正则表达式中容易误解的地方
1. \d Any digit \D Any character except a digit \s “whitespace”: space, tab, carriage return, line feed, or newline \S Anything except whitespace \w A “word character”: [A-Za-z0-9_] \W Any char转载 2016-11-13 21:04:48 · 412 阅读 · 0 评论 -
正则表达式全部符号解释
正则表达式全部符号解释 字符 描述 \ 将下一个字符标记为一个特殊字符、或一个原义字符、或一个 向后引用、或一个八进制转义符。例如,'n' 匹配字符 "n"。'\n' 匹配一个换行符。序列 '\\' 匹配 "\" 而 "\(" 则匹配 "("。 ^ 匹配输入字符串的开始位置。如果设置了 RegExp 对象的 Multiline 属性,^ 也匹配 '\n' 或 '\r' 之后的位置。 $ 匹转载 2016-11-13 21:05:58 · 344 阅读 · 0 评论 -
正则表达式匹配中文
转载自换联网 方法1: 正则匹配中文汉字根据页面编码不同而略有区别: GBK/GB2312编码:[x80-xff>]+ 或 [xa1-xff]+ UTF-8编码:[x{4e00}-x{9fa5}]+/u 方法2: 在vim中,可以使用 [^\x00-\x7f]\+ 来匹配所有中文。 它表示非ASCII码的集合,当然表示汉字。这是一种粗略的表示。转载 2016-11-13 21:23:36 · 3392 阅读 · 0 评论 -
正则表达式 %r{}操作符和.*? 表达式的区别
# .*? 和(.*?)表达的都是同一个意思,匹配任意字符,直到碰到第一个后面的表达式 #符号 %r{} 可以用来替代正则表达式的边界斜线/xxx/ #encoding = utf-8 require 'open-uri' test_text = "百度一下,你就知道" url = 'http://www.baidu.com/' page = open(url) text =原创 2016-11-13 21:28:32 · 1639 阅读 · 0 评论