
大数据--SPARK
lijieshare
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【SPARK是什么】
Apache Spark™ is a fast and general engine for large-scale data processing.Spark是UC Berkeley AMP lab所开源的类Hadoop MapReduce的通用并行框架,Spark,拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是Job中间输出结果可以保存在内存中,从而不再...2016-05-20 21:24:47 · 147 阅读 · 0 评论 -
【Spark环境搭建】
1、安装scala#解压scala-2.10.5.tgztar -zxvf scala-2.10.5.tgz#配置SCALA_HOMEvi /etc/profile#添加如下环境export SCALA_HOME=/home/apps/scala-2.10.5export PATH=.:$SCALA_HOME/bin:$PATH#测试scala安装是否成功#...2016-05-21 22:37:34 · 126 阅读 · 0 评论 -
【Spark Streaming介绍】
Spark Streaming is an extension of the core Spark API that enables scalable, high-throughput, fault-tolerant stream processing of live data streams. Data can be ingested from many sources like Kafka,...2016-12-26 22:34:48 · 113 阅读 · 0 评论 -
【JAVA语言之spark单词统计】
一、单词统计源码package cn.com.sparkdemo.myspark; import java.util.Arrays;import java.util.List; import org.apache.spark.SparkConf;import org.apache.spark.api.java.JavaRDD;import org.apache....2017-02-17 20:14:31 · 276 阅读 · 0 评论 -
【Spark运行模式】
Spark支持4种运行模式: 本地单机模式本地单机模式下,所有的Spark进程均运行于同一个JVM中,并行处理则通过多线程来实现。在默认情况下,单机模式启动与本地系统的CPU核心数目相同的线程。如果要设置并行的级别,则以local[N]的格式来指定一个master变量,N表示要使用的线程数目。 集群单机模式Spark集群由两类程序构成:一个驱动程序和多个执行程序。本地模式...2017-02-18 19:19:49 · 155 阅读 · 0 评论 -
【JAVA之spark streaming入门示例】
package cn.com.sparkdemo.myspark; import java.util.Arrays; import org.apache.spark.SparkConf;import org.apache.spark.api.java.function.FlatMapFunction;import org.apache.spark.api.java.fun...2017-02-18 19:46:43 · 299 阅读 · 0 评论 -
【Spark运行模式】
在使用spark-submit提交Spark任务一般有以下参数: ./bin/spark-submit \ --class <main-class> \ --master <master-url> \ --deploy-mode <deploy-mode> \ --conf <key>=<value> \...2017-12-27 20:39:56 · 117 阅读 · 0 评论