python2默认不是utf-8编码, 用正则表达式去匹配中文可能会出错,因为中文被转换为了 \xe5\x8c\xb9\xe9\x85\x8d 这种样子。 解决方法 把匹配和被匹配的字符都转换为unicode