
SparkStreaming
文章平均质量分 92
李_少
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
SparkStreaming Bulkload入Hyperbase--应用与原理
SparkStreaming Bulkload入Hyperbase–应用与原理一、环境准备见《Spark3.1.2 on TDH622》二、补充jar包三、关键代码说明接入kafka数据JavaInputDStream<ConsumerRecord<String, String>> stream = KafkaUtils.createDirectStream( ssc,原创 2021-11-09 19:04:24 · 2196 阅读 · 2 评论 -
spark笔记(二)–sparkstreaming使用updateStateByKey和mapWithState算子实现wordcount(JAVA版)
spark笔记(二)–sparkstreaming使用updateStateByKey和mapWithState算子实现wordcount(JAVA版)直接上代码:updateStateByKeyimport org.apache.log4j.Level;import org.apache.log4j.Logger;import org.apache.spark.SparkConf;import org.apache.spark.api.java.Optional;import org.apa原创 2020-08-26 21:18:55 · 303 阅读 · 1 评论 -
sparkstreaming整合kafka的两种方式
sparkstreaming整合kafka的两种方式sparkstreaming整合旧版本的kafka有两种方式,一般称为Receiver方式和Direct方式。Receiver方式Receiver-based方式是基于kafka high level api来实现的。在executor节点会单独启动一个receiver线程,去持续消费kafka数据,消费到的数据放在executor内存中,当执行batch计算时,executor会去计算这些数据。这种方式有很多缺点:由于宕机或者程序失败等其他因原创 2020-08-26 19:39:46 · 372 阅读 · 0 评论 -
SparkStreaming(Java)-管理kafka偏移量
一、环境说明 组件 版本 Kafka Kafka-0.10.2.0 Spark spark-2.2 IDEA idea64-2017 Zookeeper zookeeper-3.4.5 ...原创 2019-07-01 15:46:11 · 1848 阅读 · 3 评论