Python 字符串处理:原始字符串与正则表达式的深入探索
1. 原始字符串(Raw Strings)
在字符串中,反斜杠字符会引入转义序列,例如 \n 表示换行符, \t 表示制表符。若要在字符串中包含反斜杠,就必须使用两个反斜杠 \\ ,这会使某些字符串难以阅读。比如,在 Microsoft Windows 系统中,指定文件位置时使用反斜杠分隔文件夹名称。为了表示 Windows 系统上的文件位置,可能会这样写:
In [1]: file_path = 'C:\\MyFolder\\MySubFolder\\MyFile.txt'
In [2]: file_path
Out[2]: 'C:\\MyFolder\\MySubFolder\\MyFile.txt'
对于这种情况,原始字符串(以字符 r 开头)更为方便。原始字符串将每个反斜杠视为普通字符,而非转义序列的开始:
In [3]: file_path = r'C:\MyFolder\MySubFolder\MyFile.txt'
In [4]: file_path
Out[4]: 'C:\\MyFolder\\MySubFolder\\MyFile.txt'
Python 会将原始字符串转换为内部表示仍使用两个反斜杠字符的普通字符串。原始字符串能让代码更具可读性,尤其在使用正则表达式时。正则表达式通常包含许
超级会员免费看
订阅专栏 解锁全文
1384

被折叠的 条评论
为什么被折叠?



