正则表达式是一种强大的文本匹配工具,它可以用来处理字符串、验证输入、搜索和替换文本等。Python语言提供了re模块来支持正则表达式的使用。下面我们来介绍一些基本的正则表达式语法和例子。
### 基本语法
1. 字符匹配
使用字符直接匹配文本,例如:
```python
import re
text = 'Hello, World!'
pattern = 'W'
result = re.search(pattern, text)
if result:
print('找到了“{0}”在文本中的位置:{1}'.format(pattern, result.start()))
else:
print('没有找到“{0}”在文本中'.format(pattern))
```
2. 字符集
使用[]来匹配一个字符集,例如:
```python
import re
text = 'Hello, World!'
pattern = '[Ww]orld'
result = re.search(pattern, text)
if result:
print('找到了“{0}”在文本中的位置:{1}'.format(pattern, result.start()))
else:
print('没有找到“{0}”在文本中'.format(pattern))
```
3. 通配符
使用.来匹配任意字符,例如:
```python
import re
text = 'Hello, World!'
pattern = '.lo'
result = re.search(pattern, text)
if result:
print('找到了“{0}”在文本中的位置:{1}'.format(pattern, result.start()))
else:
print('没有找到“{0}”在文本中'.format(pattern))
```
4. 量词
使用量词来指定匹配的次数,例如:
```python
import re
text = 'Hello, World!'
pattern = 'l+'
result = re.search(pattern, text)
if result:
print('找到了“{0}”在文本中的位置:{1}'.format(pattern, result.start()))
else:
print('没有找到“{0}”在文本中'.format(pattern))
```
5. 转义字符
如果要匹配特殊字符,需要使用反斜杠进行转义。例如要匹配正则表达式符号本身就需要写成\Q和\E包围。例如:
```python
import re
text = 'Hello\Q...\EWorld!'
pattern = r'\Q...\E'
result = re.search(pattern, text)
if result:
print('找到了“{0}”在文本中的位置:{1}'.format(pattern, result.start()))
else:
print('没有找到“{0}”在文本中'.format(pattern))
```
### 例子
下面是一些完整的例子,展示如何使用Python的正则表达式模块来处理实际问题。
#### 验证电子邮件地址的格式是否正确
```python
import re
email = input('请输入电子邮件地址:')
pattern = r'^[\w\.-]+@[\w\.-]+\.\w+$'
result = re.match(pattern, email) is not None
if result:
print('电子邮件地址格式正确')
else:
print('电子邮件地址格式不正确')
```
#### 查找文本中的数字并计算它们的总和
```python
import re
text = input('请输入一串数字和文字混合的文本:')
pattern = r'\d+' # \d表示任意数字,+表示至少出现一次或多次
result_list = re.findall(pattern, text) # findall返回一个列表,包含所有匹配结果
total_sum = sum(map(int, result_list)) # map将列表中每个元素转换为整数类型并求和
print('这些数字的总和为:', total_sum)
```