Spark(1)——Spark的安装

最新推荐文章于 2024-06-28 15:00:40 发布

原创最新推荐文章于 2024-06-28 15:00:40 发布 · 411 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

大数据项目设计专栏收录该内容

1 篇文章

订阅专栏

本文介绍了Apache Spark的基本概念，包括其支持的开发语言、主要组件及应用领域，并详细讲述了如何在CentOS 6.5环境下搭建Spark测试开发环境，涵盖环境准备、配置文件编辑、启动过程及Spark UI的访问。

一.Spark简介

支持多种开发语言：Scala，Java，Python, R

涉及的领域

Spark Core数据的离线分析 -> MapReduce

Spark Streaming数据在在线分析 -> (实时处理) Strom

SparkSQL -> 功能上与Hive类似，性能上比Hive高

……

二.搭建Spark测试开发环境

2.1.环境准备

系统: centos 6.5

上传解压；tar -xvf spark-1.5.0-bin-hadoop2.6.tgz

2.2.编辑配置文件

vi conf/spark-env.sh.template

加入SPARK_LOCAL_IP= 本机的ip地址

复制刚才的文件：

cp conf/spark-env.sh.template conf/spark-env.sh

2.3.启动

./bin/spark-shell --master=local

启动说明

Spark-shell (相当于driver)，可以将代码发送集群运行，也可以在单机下运行进入到spark的安装目录

./bin/spark-shell --master=local 连接到本地服务，并使用单线程

./bin/spark-shell --master=local[n] 连接到本地服务，并使用n个单线程

./bin/spark-shell --master=local[*]连接到本地服务，*表示尽可能多得使用本地线程

./bin/spark-shell --master=集群地址连接到spark集群当中spark://master的地址:7077

2.4.spark UI访问

ip:4040

如果在虚拟机之外访问不到，请关闭防火墙。

在排除此间错误时应确保虚拟机和宿主机能ping通。

2.5.退出:

用:q或Ctrl+c退出spark-shell

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。