持续创作,加速成长!
大家好,大家都听过正则表达式,却不知道正则表达式干什么的。正则表达式是一个特殊的符号系列,它可以帮助我们检查某个字符串和某种模式匹配。在python中,re库拥有全部的正则表达式的功能。
我们先说说正则表达式的常用符号吧。
“.”字符为匹配任意单个字符。
“\”字符为转义字符。
“[…]”为字符集。
“(.*?)” 是python爬虫最常用的一个字符,叫贪心算法,可以匹配任意的字符。
eg.
`import re
a=‘xxixxjshdxxlovexxsfhxxpythonxx’
data=re.findall(‘xx(.*?)xx’)
print(data)
`
运行结果
[‘I’ ,‘love’,‘python’]
python中还有一些特殊字符:
特殊字符
所谓特殊字符,就是一些有特殊含义的字符,比如讲 runoo*b 中的 ,简单的说就是表示任何字符串的意思。如果要查找字符串中的 * 符号,则需要对 * 进行转义,即在其前加一个 \,runo*ob 匹配字符串 **runoob**。</