spark
jxhaha
不停的搬砖
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
spark 的基本知识点之基本架构
原地址:点击打开链接Distributed Systems Architecturebrought to you by Alexey GrishchenkoSkip to contentHOMEABOUTSpark Architecture60 RepliesEdit from 2015/12/17: Me转载 2016-10-11 10:23:41 · 1361 阅读 · 0 评论 -
spark基本知识点之内存管理
原地址:点击打开链接Spark Memory Management25 RepliesStarting Apache Spark version 1.6.0, memory management model has changed. The old memory management model is implemented by StaticMemoryManag转载 2016-10-11 10:28:20 · 1121 阅读 · 0 评论 -
spark基本知识点之Shuffle
原地址:点击打开链接Spark Architecture: Shuffle31 RepliesThis is my second article about Apache Spark architecture and today I will be more specific and tell you about the shuffle, one of the mo转载 2016-10-11 10:26:41 · 1245 阅读 · 0 评论 -
用intellij idea写spark代码
最近在研究spark源代码,做一些与spark mlib相关的工作,需要需要自己写一些相关的spark代码。故整理一下。 首先,下载intellij idea 官方程序,我这里下载的是其社区版(免费)。接着下载spark2.0源代码以及spark2.0 预编译版本。再下载并安装scala程序。当然如果你没有安装java sdk的话,那你需要安装java sdk(这些基本安装就不介绍了)。接下来开始原创 2016-12-12 22:36:31 · 5153 阅读 · 0 评论 -
spark 小笔记(持续添加中)
1、用spark运行程序时,如果程序需要依赖其它的jar包,一般用–jars 后面加上依赖的包,如果有多个依赖包,则这些包之间用逗号(,) 分割。其中需要注意的是,–jars 需要放在主jar 包之前,主jar 包后面的一般默认为参数。形式如下所示$SPARK_HOME --class MAIN_CLASS -jars $JARS --master yarn --deploy-mode clust原创 2017-01-23 09:11:44 · 462 阅读 · 0 评论 -
Cloudera 版spark 解决spark_shuffle aux-service 缺失的问题
CDHwebUi-> YARN (MR2 Included) -> Configuration -> NodeManager Default Group -> Advanced 在 “NodeManager Advanced Configuration Snippet (Safety Valve) for yarn-site.xml” 弹出框中粘贴如下: yarn.nodemanager原创 2017-04-12 21:21:09 · 2573 阅读 · 0 评论
分享