
spark
abcd1101
用过什么决定下限,基础原理决定上限。要相信积累的力量。
展开
-
Spark入门知识(application, job, stage, task)
http://litaotao.github.io/deep-into-spark-exection-model1.what这个技术是什么官方文档定义spark 里,job,stage,task 的概念:application(应用):其实就是用spark-submit提交的程序 job: A job is triggered by an action, like count...转载 2019-01-20 16:26:03 · 527 阅读 · 1 评论 -
Spark简单的word count,计算,stream代码
https://gitee.com/abcd_1101/BigData/tree/master/springboot-spark-demo用的是本地项目起来的spark,自己搭的rpc连不上。原创 2019-01-20 15:50:29 · 691 阅读 · 0 评论 -
Spark安装,使用docker
notice:看这篇要注意,暂时我能跑起来,web ui也能访问,但是程序连的时候报rpc问题,不知道是不是内存不够。Docker的入门 启动Docker服务:systemctl start docker.service 我们可以拉一个Ubuntu镜像,基于该镜像我们搭建Spark集群:docker pull ubuntu 下载好镜像到本地后,我们可以查看镜...转载 2019-01-06 22:16:49 · 2467 阅读 · 0 评论 -
Spark(这里只谈批处理)必知
1.what这个技术是什么官方文档定义Apache Spark™is a unified analytics engine for large-scale data processing. 就是大数据分析引擎,至于unified(统一),应该是因为下图。Combine SQL, streaming, and complex analytics.Spark powers a sta...转载 2019-05-05 14:28:26 · 4840 阅读 · 0 评论