目标
经过前几篇啰里啰嗦的介绍与环境的搭建,下面我们正式开始入手一个例子开始我们的爬虫之旅
主要学习以下知识点
方法名称 | 方法说明 |
---|---|
puppeteer.launch | 启动浏览器 |
page.goto(url) | 打开指定网站 |
page.screenshot | 把当前页面截图 |
详细api 可参考
https://blog.youkuaiyun.com/mengxiangxingdong/article/details/99237204
开始
1.代码
当前例子位于项目结构
代码:
/*
基础的方法演示 与注释
*/
const puppeteer = require('puppeteer'); //引入puppeteer库
(async () => {
const browser = await puppeteer.launch({ //启动浏览器
headless: false, //代码运行时打开浏览器方便观察
// devtools:true //打开f12界面
});
const page = await browser.newPage(); //打开浏览器的一个tab 页
await page.goto('https://www.baidu.com/'); //访问网址 https://www.baidu.com/
await page.screenshot({path: 'screenshot/example.png'}); //将当前视图所见截图
await page.waitFor(5 * 1000); //睡眠5s'
await browser.close(); //关闭浏览器
})();
1.2运行效果
遇到的问题参考解决方案
1.WebStorm编写代码有些库不提示的方法,例如puppeteer 相关的js么有提示
https://blog.youkuaiyun.com/mengxiangxingdong/article/details/99102525
2.ERROR: Failed to download Chromium r609904! Set “PUPPETEER_SKIP_CHROMIUM_DOWNLOAD” env variable t…
https://blog.youkuaiyun.com/weixin_33721427/article/details/88452829
参考博客
https://blog.youkuaiyun.com/wd1024719195/article/details/79914030