Spark系统学习知识
无
斗罗昊天锤
无所谓
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
第三章、Spark核心编程 — 使用Java、Scala开发WordCount程序
一、开发WordCount程序Java示例代码package com.lj.sparkcore;import org.apache.spark.SparkConf;import org.apache.spark.api.java.JavaPairRDD;import org.apache.spark.api.java.JavaRDD;import org.apache.spark.a...原创 2020-05-06 13:34:55 · 298 阅读 · 0 评论 -
第一章、Spark的前世今生
1、Spark是什么? Spark是一种通用的大数据计算框架,正如传统大数据技术Hadoop的MapReduce、Hive引擎以及Storm流式实时计算引擎等。 Spark包含了大数据领域常见的各种计算框架:比如Spark Core用于离线计算,Spark SQL用于交互式查询,Spark Streaming用于实时流式计算,Spark MLlib用于机器学习,Spark GraphX用于图...原创 2020-04-24 19:39:12 · 296 阅读 · 0 评论 -
第二章、Spark核心编程 — Spark基本工作原理与RDD
一、Spark基本工作原理分布式主要基于内存(少数情况基于磁盘)迭代式计算画图详解Spark的工作原理,如下:二、RDD以及其特点RDD是Spark提供的核心抽象,全称为Resillient Distributed Dataset,即弹性分布式数据集。RDD在抽象上来说是一种元素集合,包含了数据。它是被分区的,分为多个分区,每个分区分布在集群中的不同节点上,从而让RDD中的数...原创 2020-04-24 19:59:17 · 393 阅读 · 0 评论
分享