063 SparkStream数据接收方式

本文介绍了Spark Streaming中处理实时数据流的两种基本方法:BasicSource和AdvancedSource。BasicSource通过内置API实现简单的WordCount示例;而AdvancedSource则利用数据接收器实现更复杂的数据拉取与处理流程,支持DirectApproach等高级特性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1.两种方式

  

 

2.Basic Source

  由StreamingContext可以提供的API

  上面做的wordcount中的方式就算是第一种方式。

 

3.Advanced Source

  使用数据接收器

    线程负责转换接受数据,数据产生方主动将数据发送给SparkStreaming应用程序

    Receiver接收到数据后,就存储下来

    所以会有一个一直运行的job存在

    数据传输方式:push方式。

  Direct Approach,直接方式

    通过第三方的jar文件读取数据,数据不会在集群中形成block块

    就不需要启动一个专门的jpb执行Receiver的工作

    数据的传输方式:poll方式

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值