Python正则表达式

本文介绍了Python中正则表达式的使用方法,包括单个匹配、多个匹配、字符串分割、编译及替换等功能,并通过实例演示如何应用这些技巧。

Python中的正则表达式模块为re

单个匹配

Python中,正则表达式单个匹配有两种,一种是search()(对目标字符串整个进行匹配),另一种是match()(只对目标字符串开头进行匹配),匹配成功返回一个Match对象,匹配失败返回None

import re
# 全文匹配
re.search(r'^\d{3}\-\d{3,8}$', '010-12345')
# 开头匹配
re.match(r'^\d{3}\-\d{3,8}$', '010-12345')
# <_sre.SRE_Match object; span=(0, 9), match='010-12345'>

对于search()match()搜索返回的match对象m,可以使用m.group()获取匹配字符串。

group()函数还可以用在捕获特定分组上,下标0代表匹配到的完整字符串,后续下标代表捕获的特定分组:

>>> m = re.match(r"(\w+) (\w+)", "Isaac Newton, physicist")
>>> m.group(0)       # The entire match
'Isaac Newton'
>>> m.group(1)       # The first parenthesized subgroup.
'Isaac'
>>> m.group(2)       # The second parenthesized subgroup.
'Newton'
>>> m.group(1, 2)    # Multiple arguments give us a tuple.
('Isaac', 'Newton')

如果多个()嵌套的话,外层括号表达式的下标顺序在内层括号表达式之前

多个匹配

当要搜索一个字符串中所有匹配的子串时,就要使用findall()函数了,函数结果返回一个list,里面包含所有匹配的字符串,如果没有匹配字符串则为空list

>>> re.findall(r'\d+', '12a34b56c')
['12', '34', '56']

字符串分割

re模块还提供了比普通split()更强大的分割字符串功能,函数签名如下:

re.split(pattern, string, maxsplit=0, flags=0)

使用示例如下:

>>> 'a b  c'.split(' ')
['a', 'b', '', '', 'c']

>>> re.split(r'\s+', 'a b  c')
['a', 'b', 'c']

# 把不规范的输入规范化
>>> re.split(r'[\s\,\;]+', 'a,b;; c  d')
['a', 'b', 'c', 'd']

普通的字符串分割返回分隔符以外的字符list:

>>> re.split(r'\W+', 'Words, words, words.')
['Words', 'words', 'words', '']

当正则表达式内包含捕捉括号时(),则会一起返回分隔符:

>>> re.split(r'(\W+)', 'Words, words, words.')
['Words', ', ', 'words', ', ', 'words', '.', '']

当目标字符串以分割符开头或结尾时时,会分别分割出一个空字符串''

>>> re.split(r'\w+', 'a.c')
['', '.', '']
# 以分隔符开头,开头切出一个''。以分隔符结尾,结尾再切出一个''。

可以设置一个最大分割次数:

>>> re.split(r'\W+', 'Words, words, words.', 1)
['Words', 'words, words.']

可以设置一个忽略大小写标志re.IGNORECASE

>>> re.split('[a-f]+', '0a3B9', flags=re.IGNORECASE)
['0', '3', '9']

编译

当需要多次使用某个正则表达式时,可以预先编译,然后调用match()search()findall()等方法:

>>> import re
# 编译:
>>> re_telephone = re.compile(r'^(\d{3})-(\d{3,8})$')
# 使用:
>>> re_telephone.match('010-12345').groups()
('010', '12345')
>>> re_telephone.search('010-8086').groups()
('010', '8086')

总结一下,不编译的使用方法:

re.search(r'\w+', srcStr)

编译后再使用:

rc = re.compile(r'\w+')
rc.search(r'\W+', srcStr)

替换

Python中字符串替换的函数是re.sub(pattern, replacement, string, count=0, flags=0),其中replacement可以是字符串,也可以是函数。count代表要替换的个数,0为全部替换,使用示例:

>>> import re
>>> re.sub(r'\d+', '数', '1f2rgt3')
'数f数rgt数'
源码来自:https://pan.quark.cn/s/41b9d28f0d6d 在信息技术领域中,jQuery作为一个广受欢迎的JavaScript框架,显著简化了诸多操作,包括对HTML文档的遍历、事件的管理、动画的设计以及Ajax通信等。 本篇文档将深入阐释如何运用jQuery达成一个图片自动播放的功能,这种效果常用于网站的轮播展示或幻灯片演示,有助于优化用户与页面的互动,使网页呈现更加动态的视觉体验。 为了有效实施这一功能,首先需掌握jQuery的核心操作。 通过$符号作为接口,jQuery能够迅速选取DOM组件,例如$("#id")用于选取具有特定ID的元素,而$(".class")则能选取所有应用了某类class的元素。 在选定元素之后,可以执行多种行为,诸如事件监听、样式的变更、内容的更新以及动画的制作等。 关于“一个基于jQuery的图片自动播放功能”,首要任务是准备一组图片素材,这些素材将被整合至一个容器元素之中。 例如,可以构建一个div元素,将其宽度设定为单张图片的尺寸,再借助CSS实现溢出内容的隐藏,从而构建出水平滚动的初始框架。 ```html<div id="slider"> <img src="image1.jpg" alt="Image 1"> <img src="image2.jpg" alt="Image 2"> <!-- 更多图片内容... --></div>```接着,需要编写jQuery脚本以实现图片的自动切换。 这通常涉及到定时器的运用,以设定周期性间隔自动更换当前显示的图片。 通过使用`.fadeOut()`和`.fadeIn()`方法,能够实现图片间的平滑过渡,增强视觉效果。 ```javascript$(document).re...
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值