正则
流量猎手
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
常用正则
text = re.sub(r'</?div[^>]*>', '', text) # 去除掉HTML注释 text = re.sub(r'<!--.+?-->', '', text) # 删除p标签里面的属性 text = re.sub(r'<p[^>]+>', '<p>', text) # 删除img标签里面除src以外的属性 text =...原创 2020-12-08 23:15:29 · 121 阅读 · 0 评论 -
正则表达式‘rf
# -*- coding: UTF-8 -*-import resite_url = { 'baidu.com', '58.com', '163.com', 'sina.com.cn', 'aliyun.com', 'people.com',}sites_filter = re.compile(rf'({"|".join(site_url)})', re.I)# r': 一般用在正则表达式中,称为原始字符串,作用是将Python语法中的反斜杠转义.原创 2020-12-07 19:09:55 · 1187 阅读 · 0 评论 -
正则 ?= ?<= ?<! 的用法,学习记录
// 前瞻:exp1(?=exp2) 查找exp2前面的exp1// 后顾:(?<=exp2)exp1 查找exp2后面的exp1// 负前瞻:exp1(?!exp2) 查找后面不是exp2的exp1// 负后顾:(?<!exp2)exp1 查找前面不是exp2的exp1原创 2020-11-21 20:31:30 · 252 阅读 · 0 评论
分享