正则表达式与计算机视觉实用指南
1. 正则表达式的使用
正则表达式的调整可能颇具挑战性,不过在线正则表达式工具能在学习如何正确构建和测试正则表达式时提供很大帮助。这类在线测试工具通常有两个区域,一个用于编写正则表达式,另一个用于输入要测试的字符串,工具会高亮显示匹配的部分。
1.1 数据验证
在验证数据输入时,正则表达式非常有用。例如,要验证输入的文本是否为有效的电子邮件地址,可以使用以下代码:
import re
regex = '^[\w_\.+-]+@[\w_\.-]+\.[\w_-]+$'
while True:
text = input("Enter an email address: ")
if re.search(regex, text):
print("valid")
else:
print("invalid")
此程序会不断提示输入电子邮件地址,并报告其是否有效。在编写自己的正则表达式之前,建议先在互联网上搜索,因为对于常见的验证需求,很可能已经有人创建了合适的正则表达式。
1.2 网页数据抓取
使用正则表达式可以从网页的 HTML 内容中抓取信息。例如,要获取一本书在亚马逊的排名,可以使用以下代码:
import re
import urllib.request
regex = '#([\d,]+) in Books'
url = 'https://
超级会员免费看
订阅专栏 解锁全文
11

被折叠的 条评论
为什么被折叠?



