Python 3基础教程32-正则

本文介绍了Python中正则表达式的使用方法,并通过实例演示了如何查找特定模式的字符串,如数字和姓名等。读者将学会基本的正则表达式语法,并能进行简单的文本解析任务。

本文介绍Python的正则,通过本文介绍和一个练习,对正则有一个基本了解就可以。

# 正则表达式
'''
正则表达式是有一些特殊字符组成,能够帮你找到一些符合一定规则的字符串
先来了解几个符号所代表的意思

\d   匹配所有的数字
\D   匹配所有,但是数字除外
\s   空格
\S   匹配所有但是空格除外
\w   匹配所有的字母
\W   匹配所有但是字母除外
.    任意除换行符 \n
\.   表示点符号,斜杠本身是转义字符
关于正则知识应用,推荐一篇文章:http://www.toutiao.com/i6411296780985565698/

常见的表达式举例:
{1,3}  表示数字1到3范围
+      匹配1个或者更多
?     匹配0个或者1个结果
*      匹配0个或者更多结果
$      匹配字符串的结尾部分
^      匹配字符串的开始部分
|      匹配左右表达式任意一个
[]     字符集任意范围,例如[A-Z]表示大写A到Z
{x}    计算一共找到x的数量

一些空格符:
\n     换行
\s     空格
\t     一个tab,制表符
\e     转换字符串,转义
\f     form feed
\r     return

记住这些:

. + * ? [ ] $ ^ ( ) { } | \

'''

# 举例一个应用
import re

exampleString = '''
Anthony is 18 years old, and Daniel is 27 years old.
Tom is 78 and his grandfather,Bob is 102.
'''
# \d表示所有数字,{1,3}表示1到3范围的数字
ages = re.findall(r'\d{1,3}', exampleString)

# 下面的*表示匹配多个大写A-Z或者小写a-z
names = re.findall(r'[A-Z][a-z]*', exampleString)
print(ages)
print(names)

# 我们把姓名和年龄信息保存到一个字典,然后输出
# 先定义一个空字典
ageDict = {}

x = 0

for eachName in names:
    # 把名称作为键,年龄作为值,根据名称去设置年龄值,这样就匹配上
    ageDict[eachName] = ages[x]
    x+=1
print(ageDict)

练习二:

如果你有Selenium使用经验,看看这个文章http://blog.youkuaiyun.com/u011541946/article/details/68485981

评论 3
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值