记录一下使用puppeteer遇到反爬情况时的设置处理
# 启动设置
const browser = await puppeteer.launch({
headless: true,
args: [
'--no-sandbox',
'--disable-setuid-sandbox',
'--disable-blink-features=AutomationControlled',
],
dumpio: false,
});
# webdriver
// webdriver
await page.evaluateOnNewDocument(() => {
const newProto = navigator.__proto__;
delete newProto.webdriver; //删除 navigator.webdriver字段
navigator.__proto__ = newProto;
});
# window.chrome
// 添加 window.chrome字段,向内部填充一些值
await page.evaluateOnNewDocument(() => {
window.chrome = {
};
window.chrome.app = {
InstallState: 'hehe',
RunningState

这篇博客详细记录了使用Puppeteer在遇到反爬虫策略时的配置方法,包括启动设置、WebDriver配置、Chrome窗口设置、UserAgent伪装、插件管理、语言设置以及WebGL相关权限的调整。
最低0.47元/天 解锁文章
1704

被折叠的 条评论
为什么被折叠?



