如何使用RegEX Tester工具通过正则表达式测试提取数据

本文介绍正则表达式的概念及应用,特别强调其在数据处理中的重要性,并推荐了一个名为RegEXTester的工具,用于帮助测试人员提取和保存正则表达式过滤结果。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

正则表达式,又称规则表达式(英语:Regular Expression,在代码中常简写为regex、regexp或RE),计算机科学的一个概念。正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本。(以上内容来之百度百科)

自从工作中需要接触到处理大量数据后,是真的觉得正则表达式是个好东西,不止对开发来说,对测试人员同样重要,通过合理的使用正则表达式可以精准的提取出想要的数据。

编程能力强的同学可以使用各种语言写一些小工具来处理数据,但是对于编程能力相对比较薄弱的测试人员可能就会有点难度,所以这里给推荐一个可以提取保存正则表达式过滤结果的小工具:RegEX Tester, 可以去我的csdn下载里面下载

RegEXTester下载

下载好以后直接点击就可以运行,接下来简单说下用法:

工具界面显示如上图,输入正则表达式和待测文本后点击Test按钮,若有返回即可在下方结果显示区域显示测试结果。

下面举个例子详细介绍下用法。

此处以网易云音乐评论距离,先打开网易云网页版,随便找首歌,点击进入评论,在网络请求中找到评论的接口,查看接口显示内容,提取json文本,可以看到content字段就是评论

这个是优化显示的json格式,实际显示如下图,红框标注处就是我们要提取的内容

在工具中输入正则表达式  "content":"(.+?)"  (正则的详细用法可以参考  正则表达式-教程 | 菜鸟教程),点击Test按钮,匹配到文本会在待测区已红色字体显示,同时会在结果区展示所有匹配结果。点击Export result 按钮可将测试结果导出为csv文件(中文可能用excel打开可能会有乱码,先用notepad++打开将文本编码方式更改为ANSI后再用excel打开即可)

最后展示结果如下,我们已经成功的将这段杂乱的json中的评论内容提取出来了。

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值