使用node爬取页面图片并保存到本地（以获取码农网站首页图片为例）

最新推荐文章于 2025-05-08 15:54:08 发布

凤儿0901

最新推荐文章于 2025-05-08 15:54:08 发布

阅读量1.8k

点赞数

CC 4.0 BY-SA版权

分类专栏：节点 http 文章标签： nodejs

本文链接：https://blog.youkuaiyun.com/weixin_38033086/article/details/82225507

本教程将指导你如何使用Node.js进行网页爬虫，以码农网为例，通过request库发送请求，cheerio库解析HTML，抓取首页图片并将其保存到本地的image文件夹中。首先安装Node.js，然后创建项目目录并初始化，接着安装request和cheerio包，最后编写并运行爬虫脚本，即可完成图片下载。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

安装node
创建文件夹 mkdir firstSpider
cmd 进入创建的文件夹 cd firstSpider
npm init （初始化工程）工程的一些基本信息
安装第三方包注：http模块、fs模块都是内置的包不需要再安装需要安装的包有request(发请求)，cheerio（相当于jquery）

新建firstSpider.js 新建image（存放下载的图片）

var request=require("request");
var http = require('http')
var cheerio=require("cheerio");
var fs = require('fs')
request('http://www.codeceo.com/',function(error,response,body){
	$=cheerio.load(body);  
	$(".home.blog img").each(function(i,v){   //获取body下所有的图片路径
		saveImage($(this).attr("src"),"image/"+i+".png")
	})
})

//保存图片
function saveImage(url,path) {
    http.get(url,function (req,res) {
        var imgData = '';
        req.on('data',function (chunk) {
            imgData += chunk;
        })
		req.setEncoding('binary');
        req.on('end',function () {
            fs.writeF