关于使用正则表达式解析网页内容 正则表达式用于对字符串进行操作,事先定义好特定的规则,利用这个规则对字符串进行过滤。对网页内容解析时,可以将源代码变为字符串,利用正则表达式进行匹配。 常见的正则字符和含义 模式 描述 模式 描述 . 匹配任意字符,除了换行符 \s 匹配空白字符串 * 匹配前一个字符0次或多次 \S 匹配任何非空白字符串 + 匹配前一个字符1次或多次 \d 匹配数字,等价于 [0-9] ? 匹配前一个字符0次或1次 \D 匹配任何非数字,等价于 [^0-9] ^ 匹配字符串开头