Python正则表达式

import  re
s   =   'Hello  from    csev@umich.edu  to  cwen@iupui.edu  about   the meeting @2PM'
lst =   re.findall('\S+@\S+',   s)
print   lst

要注意,\S+是指有至少一个的非空字符。 上面的输出结果是['csev@umich.edu', 'cwen@iupui.edu']

将搜索与抽取结合:

import re
target='//home//moon//Desktop//mbox-short.txt'
mes=open(target)

for line in mes:
    line=line.rstrip()
    if re.search('^X\S*: +',line):
        print line

运行这个程序,经过过滤的数据仅保留如下内容:
X-DSPAM-Confidence: 0.8475
X-DSPAM-Probability: 0.0000
X-DSPAM-Confidence: 0.6178
X-DSPAM-Probability: 0.0000

正则表达式括号

import re
target='//home//moon//Desktop//mbox-short.txt'
mes=open(target)

for line in mes:
    line=line.rstrip()
    x=re.findall('^X\S*: ([0-9.]+)',line)
    if len(x)>0:
        print x 

程序运行结果如下:
[‘0.8475’]
[‘0.0000’]
[‘0.6178’]
[‘0.0000’]
[‘0.6961’]
[‘0.0000’]

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值