sparkStreaming程序在线升级的两种方式

本文探讨了线上SparkStreaming应用的升级方法,包括并行升级和利用缓存数据启动新应用两种策略。并行升级允许新旧应用同时运行,确保业务连续性;而缓存数据策略则依赖于数据缓存,但需注意Checkpoint目录的独立性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

众所周知,线上的Spark Streaming应用程序都是7 * 24 * 30小时不间断运行的。因此如果需要对正在运行的应用程序进行代码的升级,那么有两种方式可以实现。

1、并行的方式

也就是升级后的Spark应用程序与旧的Spark应用程序并行,当新的应用程序没有问题时,才可以将旧的替换掉。这种方式适合于客户单独拉取自己的数据。该方法在企业中应用还是比较多的~

2、必须有缓存系统保存数据才可以,启动新的应用程序

Checkpoint目录不能共享
注意:配置了driver自动恢复机制时,如果想要根据旧的应用程序的checkpoint信息,启动新的应用程序,是不可行的。需要让新的应用程序针对新的checkpoint目录启动,或者删除之前的checkpoint目录

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值