Jmeter正则表达式提取器,只提取中文问题

在学习Jmeter正则表达式提取器时,遇到提取中文字符的困扰。虽然RegexTester可以正确提取,但在Jmeter实际应用中,中文和非中文字符的提取结果相反。问题待解决。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Jmeter正则表达式提取器,只提取中文问题

最近学习Jmeter正则表达式提取器使用,发现Jmeter正则表达式提取器在提取中文时出现一些小小的问题(小菜鸟一枚,若有错误之处,还请批评指正):


首先贴两张使用RegexTester(正则表达式测试器)提取中文的截图:
1.提取汉字
这里写图片描述

2.提取非汉字
这里写图片描述

源文本:

{"response":[{"id":"01","name":"666","tel":"010-1234567"},{"id":"02","name":"中文","tel":"18922226666"},{"id":"03","name":"abc","tel":"1234567"}]}

使用"name":"([\u4e00-\u9fa5]+?)"可以提取仅中文,使用"name":"([^\u4e00-\u9fa5]+?)"可提取非中文字符,在Jmeter中却刚好相反:
这里写图片描述


### 如何在 JMeter 中使用正则表达式提取器及其引用方法 #### 什么是正则表达式提取器正则表达式提取器JMeter 提供的一个功能强大的组件,主要用于从服务器返回的响应中提取所需的数据[^1]。通过定义特定的正则表达式模式,可以精确匹配目标数据并将其存储到变量中以便后续使用。 --- #### 配置正则表达式提取器的关键参数 以下是配置正则表达式提取器时需要设置的主要字段: 1. **名称 (Name)** 给提取器指定一个易于识别的名字,方便管理测试计划中的多个提取器[^3]。 2. **应用范围 (Apply to)** 定义正则表达式作用于哪个部分的内容,默认情况下可以选择 `Body` 或其他选项(如 Headers)。如果仅需处理响应体,则保持默认值即可[^4]。 3. **正则表达式 (Regular Expression)** 输入用于匹配目标数据的具体正则表达式。例如,在 HTML 响应中查找 `<input>` 标签内的属性值可采用如下形式: ```regex <name=(.+?)\svalue=(.+?)> ``` 4. **模板 (Template)** 指定如何解析匹配结果。通常格式为 `$n$`,其中 n 表示捕获组编号。对于上述例子,若希望分别保存 name 和 value 的值,则模板设为 `$1$$;$2$`[^2]。 5. **匹配序号 (Match No.)** 如果存在多个符合条件的结果,可以通过此参数选择具体哪一项作为最终输出。负数表示随机选取其中之一;0 则意味着返回所有可能的匹配项列表[^1]。 6. **默认值 (Default Value)** 当没有任何满足条件的数据被找到时所使用的替代字符串。这有助于防止因缺失预期信息而导致脚本失败[^3]。 --- #### 实际操作案例分析 假设我们正在开发一款登录页面的功能测试场景,并希望通过正则表达式提取 CSRF Token 来完成安全校验流程。已知该令牌嵌套在一个隐藏输入框内,形似下面这段代码片段: ```html <input type="hidden" id="_csrf_token" name="token" value="abcde12345"> ``` 此时可以根据实际需求设计相应的正则表达式与模板组合实现自动化抓取过程: - 正则表达式:`<input.*?id="_csrf_token".*?value="(.*?)">` - 模板:`$1$` 随后将提取出来的 token 存储至自定义变量 `${CSRF_TOKEN}` 下面,从而允许在整个线程组范围内重复调用它参与动态交互逻辑构建工作流[^4]。 --- #### 调试技巧推荐 为了提高效率减少错误发生概率建议遵循以下几个原则来进行前期准备工作: - 将完整的 HTTP 请求单独运行一遍并将完整结果复制粘贴下来; - 运用第三方网站或者插件辅助验证初步构思好的规则准确性; - 只有当确认无误之后才正式集成回原项目文件当中去执行下一步骤动作[^3]。 --- ```python import re # 示例 Python 代码展示简单的正则匹配原理 response_text = '<input type="hidden" id="_csrf_token" name="token" value="abcde12345">' pattern = r'<input.*?id="_csrf_token".*?value="(.*?)">' # 对应前面提到过的正则表达式 match_result = re.search(pattern, response_text) if match_result: csrf_token_value = match_result.group(1) print(f'Extracted CSRF Token: {csrf_token_value}') else: print('No matching pattern found.') ``` ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值