python之正则表达式的学习

  接触了python后,爬虫是必不可少的。正则表达式是我们处理爬虫数据,解析HTML数据的重要工具。由于正则表达式十分复杂,这让初学者常常感到头痛。我在查找了大量资料后,发现 毕来生 总结的正则表达式的学习十分适合像我这样的初学者。因此,在本文我重现了regex(正则表达式)的常用方法。如下:

包括的内容:
1  re.match()
2  group()
3  .*?  通用匹配符,贪婪与非贪婪匹配
4  re.search()
5  re.findall()
6  re.sub()
7  re.compile()
匹配结果保存到txtcsv。(利用pandas库在代码 167 行)

 

此外我还有个问题:pandas在控制台输出的信息列是不对齐的,请问怎么使用format()方法对齐。

如图所示:

欢迎在https://blog.youkuaiyun.com/qq_36090423 交流。

以上所有源码在createRegex.py,已上传至 https://download.youkuaiyun.com/download/qq_36090423/10544386

另外附录正则表达的语法规范。

      

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值