内置模块---http爬虫

本文介绍Node.js内置模块stream的应用,包括数据流的概念及其在文件读取、压缩包创建与输出中的作用。同时探讨了http模块在爬虫及后端服务器(如web和API服务器)中的应用,并讲解了如何利用第三方库express创建API服务器,以及解决跨域问题的方法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

内置模块

  • stream流

    • 指的是数据流,数据是分片传输的,数据可以实现非阻塞
  • 流程

    • 读取文件
    • 创建压缩包
    • 将读取的数据写入压缩包
    • 输出压缩包
  • http模块

    • 爬虫:后端渲染的网站
  • 安装第三方类库

    • cnpm i cheerio -S
  • 后端服务器

    • web服务器(静态服务器)
    • api服务器(用于暴露后端接口)
  • 请求头部报文

    • General------请求基本信息
    • Response Header-----响应头
    • Request Header----请求头
    • 携带参数 —query string paramters(get请求)、form data(post请求)
  • Node.js读取文件都是二进制流 Buffer、binary

    • Node.js中的event模块
      • 事件发布----on(事件名称,回调函数)
      • 事件订阅----emit(事件名称)
  • Node.js中api服务器的创建,我们使用第三方库 ----express

  • 后端解决跨域问题

    • 设置请求头解决跨域–需要在html文件里用ajax来接收接口
    • 使用中间件—第三方的包–cors
    • 反向代理
      • 基本原理:我们的后端帮助我们请求数据,再将数据发送给我们的前端
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值