实时计算的需求和解决方案（Kafak+sparkstream+redis）

最新推荐文章于 2025-07-16 00:16:53 发布

小琳ai

最新推荐文章于 2025-07-16 00:16:53 发布

阅读量1.6k

点赞数 1

CC 4.0 BY-SA版权

分类专栏：大数据大数据之路文章标签：实时计算 sparkstream kafka redis 内存状态

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/wx740851326/article/details/83339165

大数据同时被 2 个专栏收录

17 篇文章

订阅专栏

大数据之路

15 篇文章

订阅专栏

本文介绍了一种基于Kafka、Spark Streaming和Redis的实时数据处理方案，用于处理实时计算需求，如触发告警及实时变更告警配置。通过维护数据流状态于Redis中，实现高效的状态对比与规则更新，适用于亿级数据处理。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

我们通常使用Kafak+sparkstream+redis来作为我们实时数据处理的方案，需要处理各种关于实时计算的需求。

需求一：触发告警

流式数据的某个字段是一个固定的值，比如 state是off，而一旦这个值发生了改变，我们需要触发告警，比如state变成了on。

触发告警提示这个状态值出错。等这个值再次变为off的时候，需要再次触发告警，提示这个值已经恢复正常。在这个值异常期间，告警只触发一次。

需求一解决：将数据流的状态维护在redis里面，每过来一个数据流都去与之前的数据流的状态做一个比较，然后根据规则发出告警。

需求二：实时变更告警配置表

告警的规则维护在数据库的表里，要求在变更了告警的规则之后，触发告警的规则能实时发生变更而不需要重启程序。

解决：讲告警规则也维护在redis里。

总结：如果在spark里没有好的维护内存状态的方法，可以将状态维护在redis里。

优势：spark和redis组件的分隔使得实时促发成为可能，而redis优秀的读写能力也使得其成为优秀的状态保存栈。

劣势：这个架构能够支持的范围很是有限，对于海量数据或者高并发的情景，redis的处理还有一定的局限性，而如果使用redis集群和多线程满足亿级以内的数据不成问题，性能的瓶颈多在于组件的优化上。

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。