node.js学习之路一 ---爬虫

本文介绍如何利用Express框架配合SuperAgent和Cheerio抓取CNode.js论坛的帖子标题和链接。通过实例代码展示了从请求网页到解析数据的全过程。

是的,上班时间比较闲的我又来了,趁着这个时候好好吸收吸收= =。

1.npm init  (当当当package.json出现啦~)

2.npm install --save express superagent cheerio(安装这三个,第一个是框架,第二个是用来抓取网页的,第三个是用来分析网页的)

superagent(http://visionmedia.github.io/superagent/ )

cheerio(https://github.com/cheeriojs/cheerio )  

var express=require('express');
var superagent=require('superagent');
var cheerio=require('cheerio');
var app=express();
app.get('/',function(req,res,next){
    superagent.get('https://cnodejs.org/')
        .end(function(err,sres){
            if(err){
                return next(err);
            }
            var $=cheerio.load(sres.text);
            var items=[];
            $('#topic_list .topic_title').each(function(idx,ele){
                var $element = $(ele);
                items.push({
                title: $element.attr('title'),
                href: $element.attr('href')
                });
            })
            res.send(items);
        })
})

app.listen(1998,function(req,res){
    console.log('1998')
})

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值