比较详细Python正则表达式操作指南(re使用)[10]

转载于 2014-04-19 23:12:39 发布 · 778 阅读

·

0

·

python 同时被 2 个专栏收录

24 篇文章

订阅专栏

正则表达式

11 篇文章

订阅专栏

本文深入探讨了Python中正则表达式的sub()和subn()方法的高级应用，包括如何进行复杂的搜索与替换操作，利用命名组进行更精确的匹配和替换，以及如何使用函数作为替换策略实现高度定制化的替换逻辑。

搜索和替换

其他常见的用途就是找到所有模式匹配的字符串并用不同的字符串来替换它们。sub() 方法提供一个替换值，可以是字符串或一个函数，和一个要被处理的字符串。

比较详细Python正则表达式操作指南(re使用)[10]

sub(replacement, string[, count = 0])

返回的字符串是在字符串中用 RE 最左边不重复的匹配来替换。如果模式没有发现，字符将被没有改变地返回。

可选参数 count 是模式匹配後替换的最大次数；count 必须是非负整数。缺省值是 0 表示替换所有的匹配。

这里有个使用 sub() 方法的简单例子。它用单词 "colour" 替换颜色名。

比较详细Python正则表达式操作指南(re使用)[10]

#!python

比较详细Python正则表达式操作指南(re使用)[10]

比较详细Python正则表达式操作指南(re使用)[10]

>>> p = re.compile( '(blue|white|red)' )

比较详细Python正则表达式操作指南(re使用)[10]

比较详细Python正则表达式操作指南(re使用)[10]

>>> p.sub( 'colour', 'blue socks and red shoes' )

比较详细Python正则表达式操作指南(re使用)[10]

比较详细Python正则表达式操作指南(re使用)[10]

'colour socks and colour shoes'

比较详细Python正则表达式操作指南(re使用)[10]

比较详细Python正则表达式操作指南(re使用)[10]

>>> p.sub( 'colour', 'blue socks and red shoes', count=1 )

比较详细Python正则表达式操作指南(re使用)[10]

比较详细Python正则表达式操作指南(re使用)[10]

'colour socks and red shoes'

subn() 方法作用一样，但返回的是包含新字符串和替换执行次数的两元组。

比较详细Python正则表达式操作指南(re使用)[10]

#!python

比较详细Python正则表达式操作指南(re使用)[10]

比较详细Python正则表达式操作指南(re使用)[10]

>>> p = re.compile( '(blue|white|red)' )

比较详细Python正则表达式操作指南(re使用)[10]

比较详细Python正则表达式操作指南(re使用)[10]

>>> p.subn( 'colour', 'blue socks and red shoes' )

比较详细Python正则表达式操作指南(re使用)[10]

比较详细Python正则表达式操作指南(re使用)[10]

('colour socks and colour shoes', 2 )

比较详细Python正则表达式操作指南(re使用)[10]

比较详细Python正则表达式操作指南(re使用)[10]

>>> p.subn( 'colour', 'no colours at all' )

比较详细Python正则表达式操作指南(re使用)[10]

比较详细Python正则表达式操作指南(re使用)[10]

('no colours at all' , 0)

比较详细Python正则表达式操作指南(re使用)[10]

空匹配只有在它们没有紧挨着前一个匹配时才会被替换掉。

比较详细Python正则表达式操作指南(re使用)[10]

#!python

比较详细Python正则表达式操作指南(re使用)[10]

比较详细Python正则表达式操作指南(re使用)[10]

>>> p = re.compile('x*' )

比较详细Python正则表达式操作指南(re使用)[10]

比较详细Python正则表达式操作指南(re使用)[10]

>>> p.sub('-', 'abxd' )

比较详细Python正则表达式操作指南(re使用)[10]

比较详细Python正则表达式操作指南(re使用)[10]

'-a-b-d-'

比较详细Python正则表达式操作指南(re使用)[10]

如果替换的是一个字符串，任何在其中的反斜杠都会被处理。""n" 将会被转换成一个换行符，""r"转换成回车等等。未知的转义如 ""j" 则保持原样。逆向引用，如 ""6"，被 RE 中相应的组匹配而被子串替换。这使你可以在替换後的字符串中插入原始文本的一部分。

这个例子匹配被 "{" 和 "}" 括起来的单词 "section"，并将 "section" 替换成 "subsection"。

比较详细Python正则表达式操作指南(re使用)[10]

#!python

比较详细Python正则表达式操作指南(re使用)[10]

比较详细Python正则表达式操作指南(re使用)[10]

>>> p = re.compile('section{ ( [^}]* ) }' , re.VERBOSE)

比较详细Python正则表达式操作指南(re使用)[10]

比较详细Python正则表达式操作指南(re使用)[10]

>>> p.sub(r'subsection{"1}','section{First} section{second}' )

比较详细Python正则表达式操作指南(re使用)[10]

比较详细Python正则表达式操作指南(re使用)[10]

'subsection{First} subsection{second}'

还可以指定用 (?P<name>...) 语法定义的命名组。""g<name>" 将通过组名 "name" 用子串来匹配，并且 ""g<number>" 使用相应的组号。所以 ""g<2>" 等于 ""2"，但能在替换字符串里含义不清，如 ""g<2>0"。（""20" 被解释成对组 20 的引用，而不是对後面跟着一个字母 "0" 的组 2 的引用。）

比较详细Python正则表达式操作指南(re使用)[10]

#!python

比较详细Python正则表达式操作指南(re使用)[10]

比较详细Python正则表达式操作指南(re使用)[10]

>>> p = re.compile('section{ (?P<name> [^}]* ) }' , re.VERBOSE)

比较详细Python正则表达式操作指南(re使用)[10]

比较详细Python正则表达式操作指南(re使用)[10]

>>> p.sub(r'subsection{"1}','section{First}' )

比较详细Python正则表达式操作指南(re使用)[10]

比较详细Python正则表达式操作指南(re使用)[10]

'subsection{First}'

比较详细Python正则表达式操作指南(re使用)[10]

比较详细Python正则表达式操作指南(re使用)[10]

>>> p.sub(r'subsection{"g<1>}','section{First}' )

比较详细Python正则表达式操作指南(re使用)[10]

比较详细Python正则表达式操作指南(re使用)[10]

'subsection{First}'

比较详细Python正则表达式操作指南(re使用)[10]

比较详细Python正则表达式操作指南(re使用)[10]

>>> p.sub(r'subsection{"g<name>}','section{First}' )

比较详细Python正则表达式操作指南(re使用)[10]

比较详细Python正则表达式操作指南(re使用)[10]

'subsection{First}'

比较详细Python正则表达式操作指南(re使用)[10]

替换也可以是一个甚至给你更多控制的函数。如果替换是个函数，该函数将会被模式中每一个不重复的匹配所调用。在每个调用时，函数被作为 `MatchObject` 的匹配函属，并可以使用这个信息去计算预期的字符串并返回它。

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。