Chapter11: Assignment:Extracting Data With Regular Expressions
txt文件从里面下载.
代码如下1:
import re
rf=open('regex_sum_250999.txt')
lst=list()
word=int() #Python定义必须用这样的方法定义变量
for line in rf:
line=line.rstrip()
stuff=re.findall("[0-9]+",line)
if len(stuff)==0:continue
lst.extend(stuff) #这里不用append()而用extend()的原因是为
for i in range(len(lst)): #了把stuff中的值合成一个list
word=word+int(lst[i])
print word
正则表达式:
1、[ ]
e.g:
t[io]p:满足tip或者top就行。
2、^
后面跟的字符出现在line的开头时匹配,一般写在匹配语句的开头。
3、$
写在匹配语句的结尾。
4、\
转义符
5、{ }
e.g. b{n}
b重复出现n次。
6、*
*前的字符可以被匹配零次或更多次。
7、+
+前的字符可以被匹配一次或者多次。
8、?
?前的字符可以被匹配一次或零次。(非greedy模式)
1350

被折叠的 条评论
为什么被折叠?



