- 博客(2)
- 收藏
- 关注
原创 【Spark学习笔记(二)】
前言 本系列的Spark相关内容大部分来自于尚硅谷的Spark课程,及许利杰、方亚芬老师所著的《大数据处理框架 Apache Spark 设计与实现》。 一、Spark VS Hadoop 1.Hadoop Hadoop有着自己的生态系统,其结构在随着时间的推移变得更加丰富和完善,而Hadoop最重要的模块则是HDFS和MasoReduce。 HDFS:是Hadoop的分布式文件系统,处于Hadoop生态圈的最下层,负责存储所有的数据; MapReduce:是一种编程模型,作为Hadoop的分布式计算模型
2022-04-05 16:04:09
1954
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人