hadoop Storm Spark 的区别

hadoop — Storm — Spark 的区别

StormHadoopSpark
计算模式流式处理批次处理流式批次处理
计算等级内存计算磁盘计算内存计算
核心Spouts/BoltHDFS/MPSDD
适用场景实时性流数据离线处理实时/离线处理
延时性
吞吐量
结束时间手动关闭任务结束任务结束

ps:

​ 延时性:显示结果的速度,越低则计算结果越快

​ 吞吐量:单位时间内,能够读取的数据。

Spark vs Hadoop

​ Spark属于计算引擎,而Hadoop是分布式存储,hadoop中真正用于计算的是MapReduce,Spark将计算的文件存储与HDFS中,但也不一定是HDFS也可以是在其他的分布式文件系统中。

​ Hadoop可以独立运行,而不使用Spark。

Storm vs Hadoop

​ 两者都是大数据计算框架,但Storm是在内存级计算,而Hadoop是基于磁盘级计算,数据引入Hadoop中,分发到各个节点进行处理,处理完后返回给HDFS供用户使用。而Storm支持拓扑结构来转换没用终点的数据流。因此Storm的转换从不停止,除非手动关闭。

Storm vs Spark Streaming

​ Spark Streaming 是基于spark的流式批处理引擎,其基本原理是把输入数据以某一时间间隔批量的处理,当批处理间隔缩短到秒级时,便可以用于处理实时数据流。

StormSpark Streaming
实时计算模型纯实时,来一条数据,处理一条数据准实时,对一个时间段内的数据收集起来,作为一个RDD,再处理
实时计算延迟度毫秒级秒级
吞吐量
事务机制支持完善支持,但不够完善
健壮性 / 容错性ZooKeeper,Acker,非常强Checkpoint,WAL,一般
动态调整并行度支持不支持
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值