python中的正则表达式(re模块)
基本语法讲解链接:
https://www.cnblogs.com/tina-python/p/5508402.html
实战经验
1、所有中文的unicode码的范围是[\u4e00-\u9fa5];
2、findall()时,正则表达式中每一层()包含的那些所能匹配到的元素会被放在一个通道,即一个tuple中;
3、正则表达式写的不合适,可能会因为文本中有大量和正则表达式相似的部分而造成长时间的表达式的匹配,从而使得程序一直运行而不能停止。----> 改变正则表达式