Python 字符串处理:原始字符串与正则表达式全解析
1. 原始字符串(Raw Strings)
在字符串中,反斜杠字符会引入转义序列,例如 \n 表示换行, \t 表示制表符。因此,如果要在字符串中包含反斜杠,就必须使用两个反斜杠 \\ ,这会使一些字符串难以阅读。例如,在指定文件位置时,Microsoft Windows 使用反斜杠来分隔文件夹名称。
In [1]: file_path = 'C:\\MyFolder\\MySubFolder\\MyFile.txt'
In [2]: file_path
Out[2]: 'C:\\MyFolder\\MySubFolder\\MyFile.txt'
对于这种情况,以字符 r 开头的原始字符串更为方便。它们将每个反斜杠视为普通字符,而不是转义序列的开始:
In [3]: file_path = r'C:\MyFolder\MySubFolder\MyFile.txt'
In [4]: file_path
Out[4]: 'C:\\MyFolder\\MySubFolder\\MyFile.txt'
原始字符串可以使代码更具可读性,特别是在使用正则表达式时。正则表达式通常包含许多反斜杠字符。
2. 正则表达式简介
有时,你需要识别文本中的模式,如电话号码、电子邮件地址、邮
超级会员免费看
订阅专栏 解锁全文
527

被折叠的 条评论
为什么被折叠?



