puppeteer爬虫自学(一)——安装node.js和puppeteer组件

本文介绍Node.js的基础知识及安装配置方法,并详细讲解如何使用Puppeteer模块进行网页爬取,包括生成页面截图、PDF以及抓取SPA等内容。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

puppeteer爬虫自学(一)——安装node.js和puppeteer组件

一、 node.js简介

Node.js平台使用的开发语言是JavaScript,平台提供了操作系统底层的API,方便做服务器端编程;运行于浏览器的Javascript,浏览器就是Javascript代码的解析器,而Node.js则是服务器端JS的代码解析器,存于服务器端的JS代码由Node.js来解析和应用。

二、node.js 的安装与配置

主要操作环境是win10系统。

  1. 下载node.js
    下载网址:http://nodejs.cn/download/下载与电脑相对应的版本
    我使用的是二进制包 64位,解压后可直接使用.
    在这里插入图片描述
  2. 查看node.js的版本信息
    在命令提示符中进入到nodejs目录下,然后输入 node -v(需要在node的目录下面)
    在这里插入图片描述

3、安装puppeteer模块
  Puppeteer是什么?
  Puppeteer 是一个Node库, 它提供高级API,通过DevTools Protocol 来控制Chrome 或 Chromium。 Puppeteer 默认运行为headless ,但是可以配置为运行为non-headless 。
  可以做什么
  生成页面截图或PDF
  抓取SPA 并生成预渲染内容(SSR)
  参考:https://jingyan.baidu.com/article/d5c4b52ba71fa0da560dc51d.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值