- 博客(2)
- 收藏
- 关注
原创 大数据技术与应用(Spark)
Spark是一种快速、通用、可扩展的大数据分析引擎,Spark基于内存计算,提高了在大数据环境下数据处理的实时性,同时保证了高容错性和高可伸缩性,允许用户将Spark部署在大量廉价硬件之上,形成集群。spark最大的特点是基于内存,特点是:快,易用,通用,兼容性。5.spark容错性高,它通过弹性分布式数据集RDD来实现高效容错,RDD是一组分布式的存储在节点内存中的只读性质的数据集,这些集合是弹性的,某一部分丢失或者出错,可以通过整个数据集的计算流程的血缘关系来实现重建;三:结构化数据与非结构化数据。
2024-03-04 14:56:13
952
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人