Spark特点:
- 大数据分布式计算框架,内存计算
- 分布式计算
- 内存计算 中间结果在内存 迭代
- 容错性
- 多计算范式
Spark SQL:Sql on hadoop系统,提供交互式查询、能够利用传统的可视化工具
在Spark上进行类似SQL的查询操作,报表查询等功能
GraphX:图计算引擎,大规模图运算,pagerank
MLlib:聚类分类 分类 推荐 等机器学习算法
*Application(应用程序)
就是你自己的编写的程序代码,其中包含了驱动(Driver)部分和执行
MLlib:聚类分类 分类 推荐 等机器学习算法
*Application(应用程序)
就是你自己的编写的程序代码,其中包含了驱动(Driver)部分和执行