Spark框架概览【大数据技术】

Apache Spark大数据处理框架

最新推荐文章于 2025-09-10 15:58:35 发布

转载最新推荐文章于 2025-09-10 15:58:35 发布 · 69 阅读

·

0

·

CC 4.0 BY-SA版权

原文链接：https://yq.aliyun.com/articles/622561

文章标签：

Apache Spark是一个围绕速度、易用性和复杂分析构建的大数据处理框架，最初由加州大学伯克利分校的AMPLab开发，2010年成为Apache的开源项目之一。Spark能统一处理各种类型的数据集和数据源，相较于Hadoop和Storm等技术，它在内存中的运行速度可提升100倍，在磁盘上也可提升10倍。

Apache Spark是一个围绕速度、易用性和复杂分析构建的大数据处理框架，最初在2009年由加州大学伯克利分校的AMPLab开发，并于2010年成为Apache的开源项目之一，与Hadoop和Storm等其他大数据和MapReduce技术相比，Spark有如下优势：

Spark提供了一个全面、统一的框架用于管理各种有着不同性质（文本数据、图表数据等）的数据集和数据源（批量数据或实时的流数据）的大数据处理的需求
官方资料介绍Spark可以将Hadoop集群中的应用在内存中的运行速度提升100倍，甚至能够将应用在磁盘上的运行速度提升10倍，在实际项目中也比较接近这一指标。

weixin_34248023

博客等级

码龄10年

152
原创

235
点赞

1363
收藏

5530
粉丝

关注

私信

热门文章

上一篇：: linux 11201(11203) ASM RAC 安装

下一篇：: SQL Server修改数据库对象所有者(Owner)浅析

最新评论

读完了csapp(中文名：深入理解计算机系统)
最好的我们！: 请问课后习题的答案在哪里找？找了半天都不知道在哪
java.lang.ClassCastException: com.sun.proxy.$Proxy27 cannot be cast...
僕らの手には何もないけど、－You: 涨知识了
(笔记)Linux下的准确延时,#include <linux/delay.h>调用出错
eisccn: 脸皮厚，复制别人的文章，还设置关注才能看。
本人常用资源整理(ing...)
普通网友: 近期遇到技术问题在各个技术社区找方案，偶然发现云+社区有同步Stack Overflow的技术问答，并将Stack Overflow的内容翻译成中文，例如这些：https://cloud.tencent.com/developer/ask/sof/296970、https://cloud.tencent.com/developer/ask/sof/304956 近期体验了下，翻译的质量还行，好像是用了专门的翻译技术，总体上比谷歌翻译好很多。对于国内开发者来说简直是福音，毕竟中文阅读起来更容易理解。如果遇到翻译不准确的，还可以查看英文原文对照着看，能帮助开发者提升不少效率，大家可以体验下。不过现在云+社区好像没有单独上线Stack Overflow中文内容的板块，大家想体验可以直接在社区站内（https://cloud.tencent.com/developer/search/ask-%E5%A6%82%E4%BD%95%E5%9C%A8%E7%B1%BB%E4%B8%AD%E4%BB%8E）用中文搜索技术问题试试。
hp eva 4400存储配置手记
it-qing: hello博主，这个教程里面的图片已经不能显示了。希望能修复。谢谢

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。