比较Spark与Flink

最新推荐文章于 2025-01-11 18:21:38 发布

傲雪凌霜，松柏长青

最新推荐文章于 2025-01-11 18:21:38 发布

阅读量1.3k

点赞数 23

分类专栏：大数据后端文章标签： spark flink 大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/Casual_Lei/article/details/142110455

版权

Apache Spark 和 Apache Flink 都是目前非常流行的大数据处理引擎，但它们在架构、处理模式、应用场景等方面有一些显著的区别。下面是二者的对比：

1. 处理模式

Spark:
- 主要支持批处理（Batch Processing），也能通过 Spark Streaming 处理流式数据，但 Spark Streaming 本质上是通过微批（micro-batching）的方式处理流数据，延迟相对较高。
- Spark Structured Streaming 提供了近似实时的流处理，但其背后依然是基于微批模式。
Flink:
- 专为流处理（Stream Processing）设计，具有真正的实时处理能力。批处理则被认为是流处理的一个特例，Flink 将批处理视为流处理的一部分，因此在流式计算中的性能更强，延迟更低。
- 支持低延迟的事件驱动的处理方式，更适合处理连续不断的数据流。

2. 容错机制

Spark:
- 通过 DAG（有向无环图）和 RDD 的惰性计算来进行容错，Spark 使用 lineage 来记录每个计算步骤，当发生失败时，可以根据 lineage 重新计算数据。
- 在 Spark Streaming 中，微批次中的失败任务会通过重跑整个批

最低0.47元/天解锁文章

傲雪凌霜，松柏长青

博客等级

码龄6年

175
原创

2580
点赞

1961
收藏

1990
粉丝

关注

私信

热门文章

分类专栏

后端 106篇
大数据 38篇
华为od机试 17篇
中间件 33篇
设计模式 1篇
算法 11篇
linux 6篇
机器学习 2篇
SpringCloud 7篇
容器化 2篇
数据结构 13篇
算法基础 12篇
前端 3篇
杂谈
云计算 5篇
centos 2篇
openstack 2篇

展开全部收起

上一篇：: Flink

下一篇：: Spark底层逻辑

最新评论

华为od-C卷200分题目5 - 项目排期
沿途旅程如歌蜕变: 下面这个用例，好像这个算法不对哎。 4 9 3 8 6 7 8 6 3 4
Spring Boot 集成 Kafka
我不懂就问: kafka的依赖现在是不是没有了?maven中央仓库里都找不到
Spark底层逻辑
优快云-Ada助手: 恭喜你这篇博客进入【优快云每天值得看】榜单，全部的排名请看 https://bbs.youkuaiyun.com/topics/619307073。
Flink
普通网友: 干货满满，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
Flink
优快云-Ada助手: 恭喜你这篇博客进入【优快云每天值得看】榜单，全部的排名请看 https://bbs.youkuaiyun.com/topics/619304843。

大家在看

Linux磁盘管理 982

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。