
Spark
文章平均质量分 67
网埠头
大数据分析 人工智能 物联网 区块链 机器学习 智慧农村
展开
-
Windows + IDEA + SBT 打造Spark源码阅读环境
转自:http://www.guozhongxin.com/pages/2014/10/15/spark_source_code.htmlSpark源码阅读环境的准备Spark源码是有Scala语言写成的,目前,IDEA对Scala的支持要比eclipse要好,大多数人会选在在IDEA上完成Spark平台应用的开发。因此,Spark源码阅读的IDE理所当然的选择了IDEA。转载 2015-01-30 15:42:11 · 930 阅读 · 0 评论 -
蜗龙徒行-Spark学习笔记【二】Spark shell下kmeans聚类算法的应用
在终端打开spark-shell然后在scala编辑模式下依次输入以下命令://导入算法执行所需函数库import org.apache.spark.mllib.clustering.KMeansimport org.apache.spark.mllib.linalg.Vectors// 加载并分析数据val data = sc.textFile("data原创 2015-03-26 12:07:36 · 2318 阅读 · 0 评论 -
蜗龙徒行-Spark学习笔记【四】Spark集群中使用spark-submit提交jar任务包实战经验
所遇问题:由于在IDEA下可以方便快捷地运行scala程序,所以先前并没有在终端下使用spark-submit提交打包好的jar任务包的习惯,但是其只能在local下执行,在网上搜了好多帖子都不能启动spark集群,由于实验任务紧急只能暂时作罢IDEA下任务提交,改由终端下使用spark-submit提交打包好的jar任务。原创 2015-04-14 16:27:53 · 7370 阅读 · 0 评论 -
蜗龙徒行-Spark学习笔记【三】Spark集群中worker节点扩展实战经验
Spark集群中worker节点扩展经验原创 2015-04-14 11:22:42 · 2239 阅读 · 0 评论 -
蜗龙徒行-Spark学习笔记【一】初识Spark形成、演进、发展
【一】Hadoop版本演进过程 由于Hadoop1.X 以前版本在 MapReduce 基本构架的设计上存在作业主控节点(JobTracker)单点瓶颈、作业执行延迟过长、编程框架不灵活等较多的缺陷和不足,2011 年 10 月,Hadoop 推出了基于新一代构架的 Hadoop0.23.0 测试版,该版本系列最终演化 为Hadoop2.0 版 本, 即 新 一 代 的 H原创 2014-12-15 20:58:14 · 852 阅读 · 0 评论 -
蜗龙徒行-Spark学习笔记【五】IDEA中集群运行模式的配置
IDEA中集群运行模式的配置原创 2017-07-31 23:59:11 · 1381 阅读 · 1 评论