Selenium如何让启动的浏览器和手动启动的浏览器信息一致

最新推荐文章于 2025-01-17 09:55:58 发布

原创最新推荐文章于 2025-01-17 09:55:58 发布 · 6k 阅读

38 ·

CC 4.0 BY-SA版权

文章标签：

#selenium #chrome #python

Selenium爬虫专栏收录该内容

1 篇文章

订阅专栏

本文介绍如何通过设置`--user-data-dir`参数，使用selenium启动谷歌浏览器时模仿用户行为，避免网站识别为自动化工具。步骤包括查找个人资料路径并应用相应选项。

最近在做爬虫，主要使用过了selenium包，但是发现selenium包直接调用本地浏览器，启动的是一个全新的（与手动打开的不一致），很多网站可以检测到，为了避免这个坑，给碰到相同问题的同伴提供思路，写下此文，希望对大家有所帮助。

1.打开谷歌浏览器；

2.在搜索框直接输入chrome://version/，找到“个人资料路径”；

注意：不要复制Default。

3.代码

from selenium import webdriver

option = webdriver.ChromeOptions()
option.add_argument(r'--user-data-dir=C:\Users\Liu\AppData\Local\Google\Chrome\User Data')
option.add_experimental_option('excludeSwitches', ['enable-automation'])
driver = webdriver.Chrome(options=option)

此时启动的浏览器和本地直接打开浏览器内容一致，可以跳过部分网站对selenium的检测机制。