前端js对模拟浏览器爬虫的解决方案

本文介绍了在使用Selenium + Chromedriver进行爬虫时,前端JavaScript如何识别模拟浏览器,并提供了解决方案。通过设置navigator.webdriver的getter返回undefined,以及通过添加Chrome启动参数excludeSwitches来避免被识别为自动化工具。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

前端js对模拟浏览器爬虫的解决方案

  1. 我们在开发爬虫的过程中喜欢使用Selenium + Chromedriver,然后在前端中一行Javascript代码就可以识别出来,从而把你干掉

          首先我们用一下代码启动模拟浏览器

          from selenium.webdriver import Chrome

          driver = Chrome()

          如下图:

             

 

 

 

接下来我们用一行js代码来调试window.navigator.webdriver

返回的结果为ture

接下来咱们返回正常的浏览器进行查看,运行相同的代码,如下图所示

可以看到正常的浏览器为undefined,所以我们就知道了在一些网站会知道咱们的是模拟浏览器的,这只是其中的一种方法。

同样有影响的是咱们破解了某个网站的加密,在借助模拟浏览

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值