『python学习』正则表达式学习_python 正则表达式非贪婪匹配去掉英文-优快云博客

本文链接：https://blog.youkuaiyun.com/Sbtgmz/article/details/51836874

本文详细介绍如何使用正则表达式进行字符串匹配，包括仅匹配字母、数字及两者的组合，并探讨不同匹配策略的优劣。此外，还介绍了正则表达式的常用符号和函数，帮助读者更高效地进行字符串处理。

1、只匹配字符串中的英文字母

>>> import re
>>> mys1 = "123456"
>>> mys2 = "123abc"
>>> mys3 = "abc123"
>>> mys4 = "abcdef"
>>> myl = [mys1, mys2, mys3, mys4]
>>> for s in myl:
        res = re.findall(r"[a-zA-Z]+", s)
        print res
[]
['abc']
['abc']
['abcdef']

注：同时也可以利用此来判断某字符串是否纯由数字所组成的，即如果返回结果为空列表时

2、只匹配字符串中的数字

>>> for s in myl:
        res = re.findall(r"[0-9]+", s)
        print res
['123456']
['123']
['123']
[]

注：同样地也可以用来判断某字符串是否由纯字母所组成，即如果返回结果为空列表时

3、匹配字符串中的字母和数字

>>> for s in myl:
        res = re.findall(r"[0-9a-zA-Z]+", s)
        print res
['123456']
['123abc']
['abc123']
['abcdef']

4、正则表达式常用的符号和字符

由于 csdn 的表格太难看了，故使用 MarkDown 来编辑生成表格

详见：正则表达式常用的符号和字符

5、但是经过上面的字符学习后，我们判断某字符串是否由纯数字或纯字母所组成时，可以写成如下的方式：

>>> for s in myl:
        res = re.findall(r"^[0-9]+$", s)
        print res
['123456']
[]
[]
[]
>>> for s in myl:
        res = re.findall(r"^[a-zA-Z]+$", s)
        print res
[]
[]
[]
['abcdef']

是 5 的方法好，还是 1 的方法好，个人觉得， 1 的方法的取巧性太强，在阅读代码时不够直观，而 5 的方法更加符合我们的一般思维，更容易理解，故 5 的方法更好。同样地

6、正则表达式函数与方法：

search（pattern, string, flags=0）：在字符串 string 中查找正则表达式模式 pattern 的第一次出现，flags 是可选标识符，如果匹配成功，则返回一个匹配对象，否则返回 None

注：可以通过 result.group() 来访问返回结果内容

finditer(pattern, string[,flags=0]) ：和 findall() 相同，但返回的不是列表而是迭代器，对于每个匹配，该迭代器返回一个匹配对象