浏览器自动化检测对抗：修改navigator.webdriver属性的底层实现

最新推荐文章于 2025-05-20 11:26:47 发布

原创

最新推荐文章于 2025-05-20 11:26:47 发布 · 646 阅读

5 ·

CC 4.0 BY-SA版权

文章标签：

#自动化 #python #Selenium #Playwright #Amazon #爬虫代理 #代理IP

爬虫代理

一、背景介绍：你被自动化检测拒之门外了吗？

在使用 Selenium 或 Playwright 等浏览器自动化工具爬取数据时，经常会遇到「被检测」问题，尤其像 Amazon 这样反爬策略严密的网站。常见的检测机制之一就是检查 JavaScript 中的 navigator.webdriver 属性：

console.log(navigator.webdriver); // true：表明是自动化工具

因此，本文将带你深入了解如何在浏览器中底层修改该属性，并结合代理、Cookie、User-Agent 技术，实现一个能顺利爬取 Amazon 网站商品信息的反检测爬虫。

二、环境准备

1. 安装依赖

pip install undetected-chromedriver selenium requests

我们使用 undetected-chromedriver 代替原生 Selenium 驱动，内置多种反检测机制，更适合应对大型网站的反爬。

2. 爬虫代理信息（请替换为你的真实账户信息）

# 配置代理 亿牛云爬虫代理 www.16yun.cn
proxy_host = "proxy.16yun.cn"
proxy_port = "8010"
proxy_user = "16YUN"
proxy_pass = "16IP"

三、核心步骤

✅ 第一步：配置无痕浏览器并隐藏 webdriver

from selenium import webdriver
from selenium.webdriver.chrome.options import Options
from selenium.webdriver.common.by import By
import time

def create_stealth_driver(proxy_host, proxy_port, proxy_user, proxy_pass, user_agent

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

亿牛云爬虫专家

关注关注

3
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

浏览器自动化测试：使用 Selenium 进行网页测试与错误日志抓取

2201_76125261的博客

01-13

512

浏览器自动化测试指的是通过编程方式模拟用户在浏览器中的行为，自动执行一系列的操作以验证网页的功能。这些操作可以包括点击按钮、填写表单、验证页面元素、模拟滚动等。自动化测试的目的是在开发周期中尽早发现问题，从而提高开发效率、降低错误率。本文详细介绍了如何使用 Python 的 Selenium 库进行浏览器自动化测试。通过实际示例，我们展示了如何模拟用户行为、验证页面元素、捕获错误日志以及处理页面中的动态内容。

指纹浏览器核心技术解析：从指纹生成到反检测实践（2025版）

Hotlogin的博客

03-26

1791

对200+维度特征值加权计算，实现99.8%设备唯一性标识。

参与评论您还未登录，请先登录后发表或查看评论

【学习笔记】selenium ChromeDriver 移除navigator.webdriver属性

MONKEYMONEY_的博客

12-16

1127

作为新手的我，在刚接触selenium时不了解的 Chrome Driver 一些常用属性和方法。为此特意记录了以下几项并加上注释，方便以后查阅调用。 Selenium中的ChromeOptions选项 chromeOptions是一个配置chrome启动属性的类。通过这个类，我们可以为chrome配置如下参数（这个部分可以通过selenium源码看到）：设置 chrome 二进制文件位置 (binary_location) 添加启动参数 (add_argument) 添加扩展应用 (a

深挖navigator.webdriver浏览器自动化检测的底层分析

最新发布

ip16yun的博客

05-20

1333

本文详细介绍了如何通过破解浏览器 navigator.webdriver 检测，结合爬虫代理、多线程等技术，在豆瓣图书搜索页面上批量采集图书信息。文章面向初学者，提供了分步教程，包括获取代理配置、隐藏 Selenium 特征、设置 Cookie 和 User-Agent、并发采集等操作。同时，文章还指出了常见陷阱和错误提示，帮助读者规避问题。通过本文的指导，读者可以掌握从底层破解检测、使用代理和多线程技术高效采集数据的完整流程。

2023爬虫学习笔记 -- selenium反爬虫操作（window.navigator.webdriver属性值）

Web安全工具库

03-16

1824

二、有些网站通过判断window.navigator.webdriver属性值来判断是否有爬虫行为。三、修改window.navigator.webdriver属性值。2、通过webdriver访问浏览器，该属性值为true。1、导入需要的函数，固定写法，并设置相关浏览器参数。1、正常访问浏览器，该属性值为false。4、此时检测该属性值为undefined。2、访问时添加上浏览器设置的参数。3、通过执行JS代码绕过检测机制。1、添加先关的参数，固定写法。2、请求的时候加上参数设置。

基于selenium实现12306模拟登陆

qq_39917135的博客

02-10

788

基于selenium实现12306模拟登陆 from selenium import webdriver from time import sleep def detect_selenium(browser): # 如果window.navigator.webdriver返回True则说明服务器端检测到了是selenium在进行自动化操作，若是False则未检测到 jsCode = 'return window.navigator.webdriver' if browser.exe

无头浏览器隐身术：隐藏WebDriver特征规避自动化识别的5种方法

# 无头浏览器的暗战：从自动化到拟真的人机博弈你有没有想过，当你用脚本轻松爬取网页数据时，网站背后其实正悄悄“盯着”你的一举一动？不只是IP地址、访问频率，甚至连你的鼠标移动轨迹、打字节奏、屏幕分辨率...

跨平台浏览器自动化测试：多环境执行效率提升80%的实现路径

# 跨平台浏览器自动化测试的演进之路：从痛点突围到效率革命你有没有经历过这样的场景？明明在本地跑得好好的自动化脚本，一进 CI/CD 流水线就频频报错；或者某个按钮点击操作，在 Chrome 上稳如老狗，换到 Safari...

基于Chrome DevTools协议的Python无头浏览器自动化爬虫框架

本资源标题为“浏览器自动化_ChromeDevTools协议_Python爬虫框架_基于无头浏览器控制的网页数据采集与交互模拟工具包_用于绕过反爬机制实现高效稳定的网络数据抓取与自动化测试_支持.zip”，其核心目标是提供一个...

python浏览器自动化完美反检测，selenium最佳反检测，playwright最佳反检测，PC自动化最佳反检测

weixin_45926932的博客

04-19

2406

安全过反爬反机器人的python方法，使用plarwright接管浏览器实现过检测

WebDriver中的元素状态检测表

ai30001的博客

03-21

453

方法作用 isEnabled() 检测元素是否启用 isSelected() 检测元素是否被选中 isDisplayed() 检测元素是否可见

使用Playwright绕过Webdriver检测

丿灬安之若死

12-03

1154

这样可以绕过一些滑块验证码的检测!

js的navigator.webdriver判断访问是不是模拟浏览器

User XXX Blog

10-09

1601

navigator.webdriver值为undefined是正常的浏览器，返回true说明用的是模拟浏览器。 let webdriver = navigator.webdriver; if(webdriver){ console.log('模拟浏览器') } else { console.log('正常浏览器') } - 参考： selenium 参数设置-window.navigator.webdriver - 码农教程 ...

selenium 防止window.navigator.webdriver对象检测的方法

m0_55580308的博客

04-27

1832

当我们使用selenium 去访问或爬取某些网站的时候会遇到网站对selenium检测的一些情况。而使用selenium去访问则会给window.navigator 设置webdriver属性。利用它可以实现每个页面刚加载的时候就执行Javascript语句将webdriver属性置空。正常用浏览器访问时：window.navigator属性是undefind。1.可以使用CDP(chrome开发者工具协议)解决这个问题。还有一种方法是stealth.min.js。不过该方式有时候也会被检测出来。

软件测试|web自动化测试神器playwright教程（三十九）

nhb687096的博客

01-15

1768

在我们的日常工作中，有时候会需要对网站上的数据进行爬取，但是有的网站的反爬机制会判断我们是否是使用webdriver打开的浏览器，一旦判定我们是使用webdriver打开的浏览器的话，就会使得我们无法抓取到我们想要的数据，或者是我们无法使用webdriver打开的浏览器登录到我们想要登录的网站，但是playwright提供了一个方法，让我们进行设置，逃过这一个反爬机制。Playwright 是一个强大的工具，可以帮助你绕过网站反爬检测，并执行自动化的网站爬取操作。但请务必谨慎使用，遵守法律和网站的规定。

（新）关于修改window.navigator.webdriver代码失效问题