最近工作中有时候会用到正则表达式,有点运营的小伙伴也有这个需求
此文章将记录一下工作中常用的正则表达式,方便后续回顾
目前主要使用python以及excel来解决正则表达式的问题
提取字符串中的纯数字(\d+)
- 需求:主要解决是将字符串中的数字提取出来,当然也可以设置提取数字的个数
a = '{"imgUrl":"https:\\/\\/img.fril.jp\\/img\\/269431979\\/l\\/762132424.jpg?1571653222"}'
import re
re.findall("\d+",a)
- 输出
['269431979', '762132424', '1571653222']
- 同理也可以提取纯字母
a = '{"imgUrl":"https:\\/\\/img.fril.jp\\/img\\/269431979\\/l\\/762132424.jpg?1571653222"}'
import re
re.findall("\w+",a)
- 输出
['imgUrl',
'https',
'img',
'fril',
'jp',
'img',
'269431979',
'l',
'762132424',
'jpg',
'1571653222']
- 最近发现excel也可以实现正则表达式的功能
- 一个比较简单的方式是使用方方格子中的正则表达式
- 一个是安装ExcelAPInetTool.exe来使用,后续将记录一下实现过程
提取字符串两个引号中的内容("([^"]*)")
- 需求:只将两个引号中的内容取出来,主要在json格式中提取链接
a = '{"imgUrl":"https:\\/\\/img.fril.jp\\/img\\/269431979\\/l\\/762132424.jpg?1571653222"}'
import re
re.findall("\"([^\"]*)\"",a)
- 输出
['imgUrl',
'https:\\/\\/img.fril.jp\\/img\\/269431979\\/l\\/762132424.jpg?1571653222']