加州大学伯克利分校:MapReduce Spark

从加州大学伯克利分校教授的视角,回顾了并行编程的发展历程:从MPI框架到MapReduce模型,再到Hadoop的诞生及其十年辉煌,直至Apache Spark的兴起。Spark在保留MapReduce优点的基础上,引入更多编程模式如SQL、Streaming、ML和Graph,极大简化了大数据时代的并行编程。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

加州大学伯克利分校的教授,从历史发展的角度,讲述了在超级计算机中如何编程,从而引出风行几十年的MPI编程框架,然后这个框架编程过于复杂,进而演化出了MapReduce模型,这个模型的第一个开源实践版本是Hadoop,Hadoop风光了近10年以后,其中的计算引擎MapReduce被Apache Spark所取代,Spark在MapReduce(BSP)模型基础之上,有增加了很多其它编程模式,比如SQL/Streaming/ML/Graph等等,让当今大数据时代的并行编程变得如此简单。本文是整个历史的亲见者和推动者所写,让我们从源头和根本理解并行编程的发展史!













篇幅过长,原文浏览地址https://www.slidestalk.com/s/MapReduceSpark65545

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值