使用node爬取页面图片并保存到本地 (以获取码农网站首页图片为例)

本教程将指导你如何使用Node.js进行网页爬虫,以码农网为例,通过request库发送请求,cheerio库解析HTML,抓取首页图片并将其保存到本地的image文件夹中。首先安装Node.js,然后创建项目目录并初始化,接着安装request和cheerio包,最后编写并运行爬虫脚本,即可完成图片下载。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

  1. 安装node 
  2. 创建文件夹   mkdir  firstSpider 
  3. cmd 进入创建的文件夹 cd firstSpider   
  4.  npm init (初始化工程)  工程的一些基本信息
  5. 安装第三方包    注:http模块、fs模块都是内置的包不需要再安装     需要安装的包有request(发请求),cheerio(相当于jquery)
  6. 新建firstSpider.js   新建image(存放下载的图片 )
    var request=require("request");
    var http = require('http')
    var cheerio=require("cheerio");
    var fs = require('fs')
    request('http://www.codeceo.com/',function(error,response,body){
    	$=cheerio.load(body);  
    	$(".home.blog img").each(function(i,v){   //获取body下所有的图片路径
    		saveImage($(this).attr("src"),"image/"+i+".png")
    	})
    })
    
    //保存图片
    function saveImage(url,path) {
        http.get(url,function (req,res) {
            var imgData = '';
            req.on('data',function (chunk) {
                imgData += chunk;
            })
    		req.setEncoding('binary');
            req.on('end',function () {
                fs.writeF
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值