
小白学大数据^_^
一位代码农的轨迹
专心、专注、自信、自强,坚持不懈,加油你是最棒的!
展开
-
初步认识大数据
原创 2022-02-18 15:28:25 · 761 阅读 · 0 评论 -
初识大数据
Hadoop是一个由Apache基金会所开发的分布式系统基础架构。Hadoop框架最核心的设计就是:HDFS和MapReduce。HDFS为海量的数据提供了存储,MapReduce则为海量的数据提供了计算Spark 是专为大规模数据处理而设计的快速通用的计算引擎。拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是——Job中间输出结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。hi原创 2022-02-18 15:23:49 · 992 阅读 · 0 评论