第17章 正则表达式
“代码胜于雄辩。”
——林纳斯·托瓦兹(Linus Torvalds)
许多编程语言和操作系统都支持正则表达式(regular expression):定义搜索模式的一组字符串。正则表达式可用于检索文件或其他数据中是否存在指定的复杂模式。例如,可使用正则表达式匹配文件中所有的数字。本章将学习如何定义正则表达式,将其传入类UNIX操作系统以用来检索文件的grep命令。该命令会返回文件中与指定模式匹配的文本。我们还将学习在Python中使用正则表达式检索字符串。
17.1 初始配置
开始之前,先创建一个名为zen.txt的文件。在命令行中(确保位于zen.txt所在的目录)输入命令python3 -c "import this",这会打印出蒂姆·皮特斯(Tim Peters)写的诗The Zen of Python(Python之禅):
Python之禅
优美胜于丑陋
明了胜于晦涩
简洁胜于复杂
复杂胜于凌乱
扁平胜于嵌套
间隔胜于紧凑
可读性很重要
即便假借特例的实用性之名,也不可违背这些规则
不要包容所有错误,除非你确定需要这样做
本章介绍正则表达式,用于在文本中查找复杂模式。学习如何在Python和类UNIX系统中使用正则表达式,包括初始配置、简单匹配、匹配起始位置、匹配多个字符、匹配数字、重复、转义以及正则表达式的相关工具。
订阅专栏 解锁全文
485

被折叠的 条评论
为什么被折叠?



