spark架构、部署形式和运行机理(独立集群、YARN集群)
spark 生态架构
http://dblab.xmu.edu.cn/blog/spark/
Spark最初由美国加州伯克利大学(UCBerkeley)的AMP(Algorithms, Machines and People)实验室于2009年开发, 分布式大数据并行计算框架。
在实际应用中,大数据处理主要包括以下三个类型:
复杂的批量数据处理:时间跨度通常在数十分钟到数小时之间;
...
原创
2019-08-31 12:48:56 ·
725 阅读 ·
0 评论