Python中正则表达式对中文的匹配问题

最新推荐文章于 2024-11-19 16:55:39 发布

原创最新推荐文章于 2024-11-19 16:55:39 发布 · 220 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#python

python 专栏收录该内容

3 篇文章

订阅专栏

本文介绍如何使用Python进行中文字符匹配，解决匹配不到或乱码的问题。通过将源字符串转换为Unicode编码，并设置正则表达式为Unicode编码，实现对中文的有效匹配。

http://blog.youkuaiyun.com/freedomqx/article/details/6237654

今天在用Python匹配中文的时候出了问题，要么匹配不到，要么乱码，搜索了一下，成功完成，写了一小段测试代码如下：

[python]view plaincopy
      
    
import re  
source = "s2f程序员杂志一2d3程序员杂志二2d3程序员杂志三2d3程序员杂志四2d3"  
temp = source.decode('utf8')  
xx=u"([/u4e00-/u9fa5]+)"  
pattern = re.compile(xx)  
results =  pattern.findall(temp)  
for result in results :  
  print result