text='POLO1.4自动舒适 标准价121000元 现价111600元 降幅9400元 预计再降400元 桑塔纳3000手动标准型 标准价118000元 现价107000元 降幅11000元 预计再降1000元 爱丽舍自动天窗型 标准价122800元 现价109600元 降幅13200元 预计再降400元 凯越1.6手动舒适 标准价117800元 现价107600元 降幅10200元 预计再降400元’
编程实现,提取出text文本中所有的价格。
此题目采用python正则表达式快速解决。
import re
text='''POLO1.4自动舒适 标准价121000元 现价111600元 降幅9400元
预计再降400元 桑塔纳3000手动标准型 标准价118000元 现价107000元
降幅11000元 预计再降1000元 爱丽舍自动天窗型 标准价122800元
现价109600元 降幅13200元 预计再降400元 凯越1.6手动舒适
标准价117800元 现价107600元 降幅10200元 预计再降400元'''
p=re.compile('\d+元')
list1=p.findall(text)
print(list1)
运行结果
[‘121000元’, ‘111600元’, ‘9400元’, ‘400元’, ‘118000元’, ‘107000元’, ‘11000元’, ‘1000元’, ‘122800元’, ‘109600元’, ‘13200元’, ‘400元’, ‘117800元’, ‘107600元’, ‘10200元’, ‘400元’]
编译正则表达式创建对象
正则表达式(RegularExpression)通常被简称为REs或regexes。是一些由字符和特殊符号组成的规则字符串。因此能按某种模式匹配一个有相似特征的字符串的集合,也能按某模式匹配一系列有相似特征的字符串。
Python自带一个正则表达式模块(re模块),通过这个模块可以查找、提取、替换一段有规律的信息