nodejs写的猫眼爬虫

本文介绍了一个使用Node.js、cheerio和https模块的猫眼电影网站爬虫项目。该爬虫能够抓取电影列表页上的电影标题和评分,并通过创建HTTP服务器返回JSON格式的数据。文章展示了如何设置HTTP服务器,配置请求选项,解析响应数据,以及使用cheerio进行DOM操作的具体代码。

 

 

const https = require('https')
const cheerio = require('cheerio')
const http = require('http')

http.createServer((request,response)=>{
    response.writeHead(200,{
        'Access-Control-Allow-Origin':'*'
    })
    const options = {
        hostname:'maoyan.com',
        port:443,
        path:'/',
        method:'GET',
        protocol:'https:'
    
    }
    const req = https.request(options,(res)=>{
        let data = ''
        res.on('data',(chunk)=>{
            data += chunk
        })
        res.on('end',()=>{
            filterData(data)
        })
    })
    function filterData(data){
        let $ = cheerio.load(data)
        let $movieList = $('.movie-item')
        let movies=[]
        $movieList.each((index,value)=>{
           
            movies.push({
                title:$(value).find('.movie-title').attr('title'),
                score:$(value).find('.movie-score i').text()
            })
        })
        console.log(movies);
        
        response.end(JSON.stringify(movies))
    }
    
    req.end()


}).listen(8081)

 

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值