
大数据(Hadoop/spark)
文章平均质量分 92
大数据技术
为算法工程师
这个作者很懒,什么都没留下…
展开
-
spark
sparkspark基本架构spark架构与生态spark和hadoopspark运行流程与特点spark运行模式standalone: 独立集群运行模式yarnRDD运行流程转载于:https://www.cnblogs.com/cxxjohnson/p/8909578.htmlspark基本架构spark是一个围绕速度、易用性和复杂分析构建的大数据处理框架。spark提供了一个全面、统一的框架用于管理各种不同性质(文本、图片)的数据集和数据源(批量数据或实时的流数据)的大数据处理的需求。spa转载 2021-10-10 17:06:23 · 93 阅读 · 0 评论 -
hadoop
hadoop-1hadoop二级目录三级目录hadoopHadoop是一个分布式计算和存储框架,为庞大的计算机集群提供可靠、可伸缩的应用层计算和存储支持。Hadoop允许使用简单的编程模型跨计算集群集分布式处理大型数据集,并且支持在单台计算机到就千台计算机之间进行扩展。hadoop基于Java开发,可以在多种不同硬件平台的计算机上部署和使用,其核心部分包括分布式文件系统(HDFS)和MapReduce。二级目录三级目录...转载 2021-10-09 11:13:15 · 312 阅读 · 0 评论