Jmeter(三十五)_精确实现网页爬虫

本文介绍使用JMeter实现网站文章的爬取与本地保存。通过请求网页并利用XPath提取超链接,遍历提取的文章标题保存至本地文件。再通过CSV读取标题,循环触发URL获取文章内容,最终以标题命名保存每篇文章。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Jmeter实现了一个网站文章的爬虫,可以把所有文章分类保存到本地文件中,并以文章标题命名

它原理就是对网页提交一个请求,然后把返回的所有值提取出来,利用ForEach控制器去实现遍历。下面来介绍一下如何操作。

首先我们需要对网页提交一个请求。我们对一个站点发起一个请求,观察一下返回值可以发现中间有很多中文title,这些title都是href标签,他们作为超链接可以跳转到正文

 

我们用xpath提取器获取这些href的title,并且用-1提取全部

 

 

用foreach控制器遍历提取的title,并传参

 

 

 

通过beanshell脚本将遍历提取的title保存到本地文件,文件保存为title.csv

 

 

用matchNr函数获取返回的title总数,作为后续csv提取器的循环次数

 

 

 

在循环控制器下,用csv提取器从之前保存到本地的title.csv中循环读取title,并作为参数传递到后续接口的url中

 

 

 

循环控制器下,通过csv传参,循环触发url

 

 

 

循环触发url之后,用xpath表达式从url中提取出文本,传递变量为text

 

 

 

循环控制器下,通过foreach控制器遍历之前的提取的text,保存到本地文件。文件名用遍历获取的title依次命名创建

 

 

 

注:难点在于,需要按照超链接的标题创建本地文件,并把超链接之后的文本正确保存到文件之中

 

 

 

你还在为找不到可练习的接口而烦恼吗?现在加入龙渊阁,我们手把手教你搭建属于自己的接口测试环境!

点击这里进入史上最具活力的测试交流平台

转载于:https://www.cnblogs.com/Zfc-Cjk/p/9937269.html

适合人群: 想步入性能测试领域的、测试工程师、性能测试工程师、接口自动化测试工程师、开发工程师以及感兴趣的人 适合想往 中高级开发工程师或者测试工程师发展的人员 课程目标: 你将掌握如何使用Jmeter进行性能和接口自动化测试,并可以运用到实际工作中 熟练学习Jmeter工具独立完成常见的性能测试项目熟练使用Jmeter进行脚本开发熟练使用Jmeter进行性能测试熟练使用Jmeter进行接口测试 1) 第一阶段为JMETER 5.4.1 工具使用篇,通过Jmeter 介绍和安装、http 取样器、JDBC 取样器、JMETER 组件详细讲解、配置元件、三种参数化方式教你玩转JMETER 参数化、工作过程中间所需的常用函数、聚合报告、察看结果树、汇总报告等监听器知识,后置处理器、后置处理器之正则表达式提取器提取响应内容实践、读取本地JSON格式文件实例、正则表达式操作符、正则表达式工具之Regextester, 每一个知识点采用理论加案例的方式,吃透每一个知识点,为性能测试奠定基础。 2) 第二阶段为性能测试实践篇 1、通过JMETER 实践爬虫技术,爬取第三方平台全网页地址、批量爬取国外网站壁纸10W+图片并保存到本地; 课程从基础讲起,全程以实战为基础,每个知识点通过实际项目演练讲解理论实践结合,更容易理解,就算是小白也能接受 通过系统的学习,独立完成企业性能测试任务,助力你成功升级为性能测试工程师
课程从基础讲起,全课程以实战为主,每个知识点通过实际案例演练讲解理论+实践结合,更容易理解,适合小白,低门槛,快速上手。 课程同时涵盖web端和移动端app测试,同时还加入了抓包工具的使用; 1) 第一阶段为JMETER 5.4.1 (最新版本)工具使用篇,通过Jmeter 介绍和安装、http 取样器、JDBC 取样器、JMETER 组件详细讲解、配置元件、三种参数化方式教你玩转JMETER 参数化、工作过程中间所需的常用函数、聚合报告、察看结果树、汇总报告等监听器知识,后置处理器、后置处理器之正则表达式提取器提取响应内容实践、读取本地JSON格式文件实例、正则表达式操作符、正则表达式工具之Regextester,系统全面学习正则表达式,突破JMETER 知识难点,响应断言、JMETER分布式、分布式原理、搭建JMETER 分布式、WebService协议接口测试。 每一个知识点采用理论加案例的方式,吃透每一个知识点,为性能测试实践奠定基础。 2) 第二阶段为性能测试实践篇1、通过JMETER 实践爬虫技术,爬取第三方平台全网页地址、批量爬取国外网站壁纸10W+图片并保存到本地;2、详细介绍Fiddler 抓包工具,Fiddler 抓包工具原理、Fiddler 抓取PC 端和移动端包信息、JMETER+Fiddler 结合使用对PC 端项目进行性能测试项目实践,提升PC 端性能测试能力;3、JMETER+Fiddler  结合使用对app 项目进行性能测试项目实践,提升app项目性能测试能力4、性能测试常见的业务指标和技术指标、响应时间、TPS、HPS等知识进行讲解5、通过JMETER 对移动端项目进行性能测试实战; 
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值